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Prezado academico, a partir de hoje voce inicia uma nova disciplina e 
com ela conhecera o mundo dos metodos estatfsticos e toda a sua relagao 
com a estatfstica. Que tal iniciarmos com um breve historico da estatfstica? 

Para voce ter ideia de como a estatfstica e antiga, estima-se que por volta de 
5000 a.C. os registros de presos egfpcios em documentos ja continham dados 
estatfsticos. Porem, e com a construqao das piramides, ja em 3000 a.C., que 
documentos comprovam na contagem o uso da estatfstica por causa da falta de 
mao de obra da epoca. Imagine voce que naquela epoca ja se fazia estimativa 
de quantidade de pessoas necessarias para terminar determinado trabalho. 

Mas e na China que a estatfstica se coloca em posiqao de destaque na his¬ 
toria, afinal, em 2238 a.C., quando o imperador ordenou um recenseamento 
para fins agrfcolas e comerciais, era a estatfstica que permitia contabilizar os 
dados coletados. Com o passar do tempo os recenseamentos comeqaram a 
ficar bastante comuns, tanto que, em 600 a.C., os cidadaos do Egito tinham, 
todos os anos, que declarar sua profissao e sua fonte de rendimento. 

Para voce ter noqao de como a estatfstica e importante na historia, vou 
contar uma curiosidade sobre um recenseamento. Voce conhece a Bfblia, nao 
e mesmo? O livro conta, entre outras passagens, a historia do cristianismo 
e e muito conhecido no nosso pats. Pois, entao, voce sabia que a Bfblia da 
relatos de estatfstica quando conta a historia do nascimento de Jesus? Na¬ 
quela epoca, por ordem do senado, todos os indivfduos deveriam retornar 
ao seu local de nascimento para um recenseamento, e foi nessa viagem que 
nasceu Jesus, justamente quando Jose e Maria, seus pais, estavam voltando 
a terra natal de Jose para participar do censo. 

Sendo assim, podemos dizer com toda a certeza que a estatfstica nasceu 
com o objetivo de coletar, contar e organizar dados, sempre procurando pes- 
quisar todos os indivfduos. Mas e claro que a palavra estatfstica nao existia 
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em epocas tao distantes, isto e algo mais recente! Ela foi usada pela primeira 
vez pelo alemao Gottfried Achenwall, em 1 752, e deriva da palavra latina sta¬ 
tus, que significa estado, numa alusao ao aproveitamento que os governantes 
estavam fazendo da estatfstica. Tudo a ver com o recenseamento, nao e mesmo? 

Daf voce deve estar se perguntando, mas onde entram os tais metodos es- 
tatfsticos? Os metodos estatfsticos fazem parte da estatfstica, pois servem para 
fazer o tratamento dos dados coletados nas mais diversas situaqoes. Por exemplo, 
vamos supor que uma empresa esta se preparando para lanqar um novo produto 
e precisa conhecer as preferencias dos consumidores no mercado de interesse 
em que pretende atuar. Para isso, esta empresa pode fazer uma pesquisa de 
mercado entrevistando um numero de residences escolhidas aleatoriamente. 
E podera usar os resultados para estimar as preferencias de toda a populaqao. 
Para isso e provavel que esta empresa tenha coletado os dados e utilizado algum 
metodo quantitative, como o desvio-padrao, o coeficiente de variaqao ou mesmo 
a regressao linear para saber ou estimar a quantidade de futuros compradores 
do produto que quer lanqar. 

Enfim, tudo isso voce vai estudar ao longo da disciplina, de maneira gradual, 
passando pelos conceitos basicos, pelas medidas de posiqao e de dispersao, 
terminando por fazer regressoes com o intuito de comparar dados. Claro que 
neste fnterim voce tambem vai aprender sobre os graficos e as distribuiqoes de 
frequencia, que permitem a visualizaqao dos dados coletados. 

Gostou? Entao pode esperar muito mais! A disciplina Ihe dara muitos sub¬ 
sidies para trabalhos de pesquisa, futuros artigos e projetos! 


Bons estudos! 
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j Segao 3: Organizagao e deflagao de dados 

Nesta segao, apresentaremos as principals formas 
de organizagao e complementaremos com estudos 
sobre deflagao de dados. 
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Introdu^ao ao estudo 

Nos dias de hoje, muitas informagoes que nos chegam sobre o comporta- 
mento das pessoas em relaqao aos mais variados temas sao frutos de pesquisas 
que, com certeza, receberam algum tipo de tratamento estatfstico. As vezes, ate 
comerciais procuram estimular nossa curiosidade por meio de algum questiona- 
mento estatfstico. Talvez voce ja tenha visto a propaganda que fala: "A ciencia 
ainda nao sabe explicar por que um ser humano boceja quando outro boceja 
ao seu lado." Entao, a pergunta, em si, e uma afirmaqao - se voce boceja, seu 
colega ao lado vai bocejar tambem -, mas ela so foi possfvel de ser feita por- 
que a observaqao desse fato foi acompanhada, tabulada, e demonstrou que, na 
grande maioria dos casos observados, bocejar era comum entre pessoas que 
estavam proximas umas das outras. 

Bom, mas o objetivo aqui nao era leva-lo a ficar com sono... e, por favor, 
mantenha os olhos bem abertos para poder aprender cada vez mais. Um 
questionamento interessante para voce seria: "Por que as pessoas resolvem 
estudar Administraqao de Empresas?" Com certeza, as pessoas apresentarao os 
mais diversos motivos, entao tais motivos devem ser agrupados por itens em 
comum e tabulados para, depois, fornecerem informaqoes - por exemplo, em 
percentuais — que possam revelar os motivos mais importantes que levaram 
o grupo de pessoas pesquisadas a estudar Administraqao. E, assim, muitas 
questoes instigantes necessitam da aplicaqao de conhecimentos estatfsticos 
para serem respondidas. Nesse sentido, o conteudo desta unidade esta divi- 
dido em tres seqoes: Seqao 1 — Introduqao a Estatistica e Fases de sua Apli- 
caqao, Seqao 2 — A Informatizaqao da Estatfstica e Seqao 3 — Organizaqao 
e Deflaqao de Dados. Logo, nesta unidade vamos tratar dos conceitos basicos 
necessarios a compreensao da estatfstica como area do conhecimento humano 
e, sobretudo, como fornecedora de ferramentais praticos que possibilitam a 
soluqao de problemas cotidianos dos mais variados. O foco esta na revisao 
dos principals conceito se no entendimento da relaqao entre a disciplina e a 
realidade das empresas. 
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Introclucao a estatistica e fases de 
sua aplicacao 


Caro aluno, creio que voce, toda vez que inicia o estudo de uma nova dis¬ 
ci pi i na, tenha necessidade de conhece-la melhor, eessa necessidade aumenta 
quando tal disciplina envolve uma area do conhecimento diferente daquela 
que sustenta sua formagao principal. Pois bem, esse e o caso da disciplina 
de Estatistica, que e a base estrutural de Metodos Quantitativos. Assim, nesta 
segao vamos juntos conhecer um pouco mais sobre a historia da Estatistica, 
seus conceitos basicos e as etapas de aplicagao. Vamos la! Vamos dar inicio 
aos nossos estudos. 

1.1 Evolu 9 ao da estatistica 

A estatistica tern suas primeiras aplicagoes associadas as necessidades do 
Estado de ter uma fonte de informagoes agrupadas para poder formular politicas 
publicas. Assim, dados economicos e demograficos davam suporte aos estudos 
da administragao publica — em especial para fins militares e tributaries. Os 
momentos mais importantes sao: 

j A obra pioneira de Francesco Sansovini, de 1561, sobre estatistica des- 
critiva e o reconhecimento por parte da Igreja Catolica Romana da im- 
portancia de manter-se arquivos com registros de batismos, casamentos 
e obitos — e que se tornaram obrigatorios a partir do Concflio de Trento 
(1545-1563); 

_i Posteriormente, os estudos de Gottfried Achenwall (1 719-1 772), professor 
da Universidade de Gottingen e a quern se atribui a criagao do termo 
"estatfstica", aprimoraram a sistematizagao e definigao da mesma orien- 
tagao descritiva dos estatfsticos italianos; 

_l A estatistica comega a encaminhar-se para aquilo que seria seu futuro 
como "ciencia do significado e uso dos dados" (MEMORIA, 2004, p. 12). 
Como estudo independente, comeqa a ganhar espaqo com o livro de John 
Graunt de 1662. 


Os dados usados por Graunt compreendiam uma serie 
anual de 1 604 a 1 660, coletados nas paroquias de Lon- 
dres, de onde ele tirou as seguintes conclusoes: que havia 
maior nascimento de criangas do sexo masculino, mas 
havia distribuigao aproximadamente igual de ambos os 
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sexos na populaqao geral; alta mortalidade nos primeiros 
anos de vida; maior mortalidade nas zonas urbanas em 
relaqao as zonas rurais (MEMORIA, 2014, p. 13). 

j Em 1683, William Petty denominou a estatistica como Aritmetica Polftica, 
que para ele era a arte de raciocinar observando os dados sobre os fatos 
relacionados ao governo; 

j Edmond Halley construiu a primeira tabela de sobrevivencia, que serviu 
de base para o calculo atuarial — em especial para o seguro de vida; 

j Blaise Pascal (1623-1662) e Pierre de Fermat (1601 -1665) investigaram a 
questao das probabilidades visando solucionar problemas relacionados 
aos jogos de azar, de tal forma que: 

Os primeiros problemas sobre probabilidades refletiram 
o desenvolvimento da analise combinatoria em jogos de 
azar. Em todos eles eram examinados os diferentes modos 
em que arranjos e combinaqdes podiam ser empregados 
na enumeraqao dos casos favoraveis. Esses problemas 
eram dominados por considerapoes sobre os casos igual- 
mente provaveis, com as probabilidades determinadas a 
priori, onde foi utilizado o seguinte tipo de raciocmio: 
dado uma urna contendo a (bolas pretas) e b (bolas bran- 
cas), a probabilidade de se extrair uma bola preta e igual 
aa/(a+b) (MEMORIA, 2014, p. 15). 

j Em especial, os feitos registrados ao longo dessa evoluqao podem ser 
resumidos nos momentos mais importantes, conforme destacou Castro 
(1967 apud GARCIA, 2010, p. 2-3): 

O primeiro perfodo se caracteriza pelos registros sistema- 
ticos e cadastros das informaqoes do Estado com finali- 
dades principals ligadas a guerra ou a interesses fiscais. 
Esse modelo vai desde o perfodo feudal ate meados do 
seculo XVII. O segundo perfodo da a estatfstica o carater 
de disciplina autonoma e se referia as analises de registros 
de batismos, casamentos e enterros. Ainda segundo Castro 
(1967), em 1949 a estatfstica foi definida em termos de 
objeto e relaqdes com as ciencias por Gottfried Achenwall. 
O terceiro perfodo constitui a evoluqao da estatfstica ate 
os dias de hoje, caracterizada por constantes aperfeiqoa- 
mentos tecnicos e cientfficos. 

Pois bem, do exposto ate aqui, chega o momento em que podemos pon- 
tuar qual e o objeto e o objetivo da Estatistica. Podemos dizer que o objeto da 
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estatistica e o estudo de fenomenos que possam ser quantificados de alguma 
forma por meio da observaqao. O objetivo da estatistica, por sua vez, e ana- 
lisar os dados obtidos em uma pesquisa e, por isso mesmo, tecer ligaqoes de 
causalidade existentes entre eles — mas essas ligaqoes so se estabelecem com 
sentido correto quando se utilizam os conhecimentos cientfficos das areas as 
quais essa pesquisa se refere. 

Dessa forma, a estatistica encontra aplicaqoes em quase todos os campos 
da atividade humana. O administrador necessita conhecer o mercado de um 
produto ou serviqo e o faz analisando dados de pesquisas de mercado; o gestor 
publico precisa compreender as finanqas publicas e, muitas vezes, utiliza-se 
de series historicas que recebem algum tratamento estatfstico como forma de 
resumir e expressar o que de fato o grupamento de dados quer dizer; os agro- 
nomos e meteorologistas necessitam conhecer as condiqoes climaticas para 
entender seus reflexos sobre o tempo e a agricultura; os biologos e os profis- 
sionais envolvidos nos segmentos de saude precisam estudar as epidemias e, a 
partir de projeqoes estatfsticas, podem preve-las e antecipar-se aos seus efeitos 
danosos na populaqao. Enfim, alem dessas, uma serie de outras aplicaqoes dos 
conhecimentos estatfsticos sao possfveis, de tal forma que: 

Atualmente, conforme comentado na seqao de intro- 
duqao, os meios informatizados dos quais dispdem os 
indivfduos e as organizaqoes possibilitam que aplicaqoes 
de alta complexidade sejam desenvolvidas a partir de um 
conjunto mfnirno de conhecimentos sobre o tratamento 
de dados. Dentre os conjuntos de tecnicas capazes de 
oferecer ferramentais eficazes para esses tratamentos, 
destacam-se os estatfsticos, geralmente muito bem fun- 
damentados e testados empiricamente. Esses metodos 
sao desenvolvidos e testados no ambiente academico e 
de pesquisa de diversas areas, tais como economia (por 
meio da econometria), contabilidade (por meio da con- 
tabilometria) e, principalmente, nas areas das ciencias 
biologicas, em especial pela utilizaqao das tecnicas que 
permitem o estudo de causa e efeito das doenqas (GAR¬ 
CIA, 2010, p. 3-4). 

Dessa forma, apresentamos no Quadro 1.1a interligaqao que existe entre a 
estatfstica e outras areas do conhecimento, de tal forma que o uso de metodos 
estatfsticos permite compreender melhor os problemas das mais diversas areas. 
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Quadro 1.1 Metodos estatisticos aplicados em diversas areas 


APLICAQAO DE METODOS ESTATiSTICOS 

' * XX & 
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Fonte: Garcia (2010, p. 5). 



Questoespara reflexao 

Voce sabia que existe um levantamento sobre a taxa de sobrevivencia 
das pequenas empresas no Brasil? Se sim, voce sabe dizer qual e sua 
atual estatistica? 


Para que a estatistica contribua para o desenvolvimento de pesquisas, ela 
necessita lanqar mao de um conjunto de metodos que permitam coletar, agrupar, 
resumir e analisar dados para, entao, apresentar os resultados obtidos pela ana- 
lise das variaveis observadas. E, pois, a partir da etapa de analise que e possivel 
obter conclusoes validas para o processo de tomada de decisao. Porem, antes 
de falarmos de metodo estatfstico, e necessario que nos familiarizemos com o 
entendimento de alguns conceitos basicos da estatistica. 

1.1.1 Estatistica: termos usuais 

Partindo do entendimento de que a estatistica constitui-se em um conjunto 
de tecnicas que objetivam descrever, analisar e interpretar os dados numeri- 


5 25 


50 


75 100 






























96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:26 - June 30, 2014 - PG-16 


8 METODOS QUANTITATIVOS 

cos de uma populaqao ou amostra, podemos, entao, destacar alguns termos 
importantes e comumente utilizados nessa area. Sao eles: 

a) Popula^ao: refere-se ao conjunto de elementos que apresentam uma 
caracterfstica em comum e com o qual se deseja fazer um estudo — 
tambem chamado de universo de dados. Nas pesquisas, deve-se definir 
claramente a populaqao para que se possa delimitar o que se pretende 
conhecer. Por exemplo, na nossa questao para reflexao, comentamos 
sobre taxa de sobrevivencia de pequenas empresas no Brasil. Bom, nossa 
populaqao, na pesquisa, sera todas as pequenas empresas brasileiras. 
Por outro lado, o primeiro passo sera pesquisar na literatura para saber 
qual e o criterio de classificaqao de pequenas empresas (qual tipo), 
pois, assim, quando encontrarmos essa taxa, teremos certeza do tipo 
de pequena empresa a que ela se refere. Comentamos isso para que 
voce fique atento a esse detalhe, pois, no Brasil, temos, no mfnimo, dois 
criterios de classificaqao de pequenas empresas: um de acordo com o 
numero de funcionarios (criterio SEBRAE) e outro de acordo com o fa- 
turamento mfnimo anual (criterio do Banco do Brasil). Observe, ainda, 
que cada pesquisa em particular pode tomar um criterio de populaqao 
ja existente ou definir sua populaqao de acordo com os interesses de 
sua pesquisa. Um exemplo de pesquisa que envolve toda a populaqao 
e o Censo Demografico, que e realizado decenalmente pelo Institute 
Brasileiro de Geografia e Estatfstica. 


Voce pode conhecer mais sobre os dados do Censo 2010 consultado a pagina do IBGE no link 
abaixo: 

<http://www.ibge.gov.br/home/estatistica/populacao/censo2010/>. 


Para saber mais 


b) Unidade: refere-se a qualquer elemento ou indivfduo da populaqao. Por 
exemplo, em relaqao aos resultados do Censo, uma entrevista com Ana 
Nery da Silva apresenta as informaqoes de escolaridade dessa mineira 
de 38 anos que concluiu o segundo grau complete. Essa mulher e uma 
unidade que foi entrevistada pelo Censo. 
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c) Amostra: e um subconjunto da populaqao, ou seja, e uma parte da 
populaqao. E sempre mais utilizada nas pesquisas do que a populaqao. 
Isso ocorre porque a populaqao envolve um numero muito grande de 
observaqoes; logo, a amostra e uma forma de trabalhar de maneira 
confiavel, com valores que expressam o que ocorre com a populaqao. 
Por exemplo, em relaqao ao Censo, poderfamos estar interessados em 
identificar o grau de escolaridade dos jovens de 28 anos do municfpio 
de Belo Horizonte. Estarfamos, entao, destacando um grupo de jovens 
especfficos e extraindo os dados de uma populaqao do Censo. Esse grupo 
de jovens seria, entao, uma amostra. 

d) Variavel: refere-se a informaqao ou ao atributo que e o objeto de estudo. 
Por exemplo, numa pesquisa sobre os universitarios, posso pesquisar o 
sexo. As variaveis podem ser qualitativas, que qualificam os dados — por 
exemplo, estado civil, sexo e escolaridade—, e podem ser quantitativas, 
isto e, podem ser mensuradas — como, por exemplo, peso, altura etc. 
Na variavel quantitativa, os dados podem ser expressos por meio de uma 
estrutura numerica, isto e, que podem ser enumerados — quantidade 
de objetos, idades, tamanho etc. A variavel quantitativa, ainda, pode ser 
continua ou discreta. 

e) Variavel discreta ou descontinua: sao os valores que obtemos por meio 
das contagens, como, por exemplo, o numero de alunos de uma sala de 
aula do 1° ano do Ensino Fundamental em 2010 = 30, em 2011 = 33, 
em 2012 = 32 e em 2013 = 35. Seus valores sao expressos, geralmente, 
por meio de numeros inteiros e nao negativos. 

f) Variavel continua: os valores obtidos por meio dessa mensuraqao corres- 
pondem ao conjunto dos numeros reais, de forma que podem assumir, 
teoricamente, qualquer valor entre dois limites. Exemplos: as horas de 
um curso, temperatura etc. 

O Quadro 1.2 apresenta um resumo sobre a classificaqao das variaveis. 
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Quadro 1.2 Classificacao das variaveis 
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Fonte: Araman e Sampaio (2009, p. 4). 

g) Dados brutos: sao os dados que se apresentam da forma como foram 
coletados e que ainda nao foram organizados. 

h) Analise dos dados: apos a coleta dos dados, e necessario realizar a 
analise dos mesmos. Os resultados da analise podem ser expostos em 
tabelas de forma sintetica e submetidos, ou nao — de acordo com cada 
pesquisa —, a um tratamento estatfstico mais profundo, em que todas 
as informaqoes reunidas nos passos anteriores sao comparadas entre si 
e analisadas. 

i) Tabelas estatisticas: sao dados agrupados em colunas e linhas. Existem 
regulamentaqoes para a construqao de tabelas estatisticas, mas, em linhas 
gerais, ela deve seguir algumas regras basicas: deve ser clara e objetiva 
e, ainda, deve demonstrar o comportamento das variaveis atraves de 
representaqoes simples que possibilitem ao leitor ter uma perfeita com- 
preensao do fenomeno sem muito esforqo. As tabelas estatfsticas podem 
ser apresentadas em serie cronologica ou temporal, serie de localizaqao 
ou geografica, serie especffica e serie de distribuiqao de frequencia. 

j) Graficos: constituem a representaqao grafica das series estatisticas de 
uma pesquisa. Tern por finalidade representar os resultados obtidos, 
permitindo apontar conclusoes acerca da evoluqao do fenomeno ob- 
servado ou da forma como este se relaciona com os valores da serie. 
Existem diferentes tipos de dados, e hoje os softwares como o Excel 
apresentam diferentes formas de composiqao dos mesmos. O essencial, 
para o pesquisador, e ter em mente que os graficos devem prezar pela 
simplicidade, clareza e veracidade dos fatos que representam. 
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k) Analise exploratoria: o termo exploratorio e sugestivo, tendo analogia 
com a palavra "desbravar", ou seja, pesquisar algo desconhecido, ex- 
plicitando novas descobertas. Ela emprega grande variedade de tecni- 
cas graficas e quantitativas (inclusive a analise de regressao) e objetiva 
maximizar a obtengao de informagoes ocultas na estrutura dos dados e 
a descoberta de variaveis importantes. Observa-se que, nesse caso, ha 
uma profundidade maior em relagao a analise dos dados, ou seja, nao 
ha uma preocupagao meramente voltada para o conhecimento sobre as 
caracterfsticas principais dos dados, mas, sim, para a busca por informa- 
goes ocultas que resultem em explicagoes, por exemplo, sobre causas e 
efeitos entre as variaveis envolvidas. Com os softwares disponfveis, essa 
tecnica possibilita a descoberta de quais tendencias, relagoes e padroes 
poderiam estar ocultos em uma colegao de dados analisados. A aplica- 
gao de tecnicas adequadas implica a analise minuciosa do problema e 
dos resultados pretendidos. 

l) Analise descritiva: menos pretensiosa do que a exploratoria, a analise 
descritiva se volta para o conhecimento dos dados em relagao as suas 
principais caracterfsticas. Isso esta longe de significar menor importan- 
cia para esse tipo de analise. Ao contrario, a diferenga de profundidade 
e extensao visa apenas adequar o tratamento as reais necessidades do 
analista. E importante que haja sempre o questionamento sobre a ade- 
quagao, ou nao, dos procedimentos utilizados em termos de resultados 
para o usuario. Nao e eficaz um tratamento que gere mais informagoes 
do que o necessario, e tampouco aquele que as gere com deficiencia. 
A analise descritiva implica o calculo de parametros que possibilitem a 
compreensao das caracterfsticas principais de um grupo de elementos. 
Entre essas caracterfsticas, podem-se destacar a soma, a media, a vari- 
ancia, o desvio-padrao, a mediana, a moda etc. 



Para saber mais 


Voce deve estudar mais sobre estatistica descritiva lendo o Capftulo 2 — "Estatistica Descritiva' 
— do livro Estatistica aplicada, dos autores Ron Larson e Betsy Farber, publicado em 2004. 


Conhecidos os principais conceitos ligados a estatistica, vamos saber um 
pouco mais sobre amostragem e metodo estatfstico. 
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1.1.2 Amostragem com metodo probabilistic© 

A teoria da amostragem garante que se possa fazer a inferencia, ou seja, a 
extrapolaqaodo que se observou na amostra para a populaqao da qual ela foi 
retirada. Do contrario, haveria grande possibiIidade desse incorrer em erro. Um 
aspecto importante para uma pesquisa cientffica e a definiqao da amostragem. 
Existem algumas formas de se fazer isso, e vamos ver a seguir algumas delas. 

Metodos probabilfsticos: nesse metodo, cada elemento da populaqao deve 
possuir uma mesma probabilidade de ser selecionado. Entao, se N corresponde 
ao tamanho da populaqao, 1/N corresponde a probabilidade de cada elemento 
ser selecionado. Esse metodo garante cientificamente a aplicaqao da inferencia 
estatfstica, ou seja, somente com base nas amostras feitas por metodos proba¬ 
bilfsticos e que podemos fazer inferences a respeito da populaqao a partir da 
analise da amostra. Alem disso, essa tecnica garante o acaso na escolha. 

Amostragem casual ou aleatoria simples: esse processo de amostragem e 
o mais simples e tambem o mais utilizado. Para formar a amostra, numeramos 
a populaqao e realizamos um sorteio aleatorio por meio do qual qualquer ele¬ 
mento da populaqao possa ser sorteado. Por exemplo, se quisermos compor uma 
amostra de 10% dos 300 professores desta universidade para uma determinada 
pesquisa, devemos, primeiramente, numerar os professores de 1 a 300. Depois 
disso, colocamos todos os numeros em uma uma, misturamos bem, e retiramos, 
um a um, trinta numeros que irao compor a amostra. Esse tipo de amostragem 
deve ser usado sempre que se tratar de uma populaqao homogenea, ou seja, 
quando ha uma distribuiqao uniforme dos dados na populaqao. O numero de 
elementos para compor uma amostra dependera de varios fatores, como tempo 
para a pesquisa, verba etc. Uma das formas de fazer esse tipo de amostragem 
e tomar cerca de 5% a 10% dos elementos da populaqao, pois quanto maior 
a amostra, maior a precisao. 

Amostragem proporcional estratificada: esse tipo de amostragem e ade- 
quado quando a populaqao e dividida em estratos ou subgrupos de populaqao. 
Nesse caso, convem que o sorteio dos elementos que irao compor a amostra 
considere os estratos da populaqao, de forma que tenhamos uma amostra sig- 
nificativa em cada estrato. Consideremos o exemplo anterior dos professores 
da universidade. Vamos obter uma amostra estratificada de 10%, supondo que, 
entre os 300 professores, 170 sejam do sexo masculino e 130, do sexo feminino. 
Dessa forma, temos dois estratos, um para o sexo masculino e outro para o sexo 
feminino. Veja como ficaria essa amostra no Quadro 1.3. Quando realizamos 
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Principios da estatistica 13 

uma amostragem estratificada, garantimos a representatividade de cada estrato 
da populaqao, o que ja nao podemos mais garantir pela amostragem casual. 

Quadro 1.3 Amostra estratificada dos professores da universidade 
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Fonte: Araman e Sampaio (2009). 


Amostragem sistematica: utilizamos esse tipo de amostragem quando os 
elementos da populaqao ja se encontram ordenados ou organizados de alguma 
maneira. Dessa forma, nao e necessario construir o sistema de referenda. Ana- 
lise o seguinte exemplo: vamos supor que um conjunto residencial seja formado 
por 216 apartamentos e que desejamos realizar uma pesquisa de opiniao la. 
Para compor uma amostra composta por 36 apartamentos, podemos usar o 
seguinte procedimento: 

1. Se desejamos formar uma amostra com 36 apartamentos em um total 
de 21 6, entao temos 21 6/36 = 6. 

2. Em seguida, escolhemos por sorteio um numero entre 01 e 06 e que 
sera o primeiro elemento da amostra. 

3. Os demais elementos seriam considerados de seis em seis a partir desse 
primeiro. 

4. Assim, suponhamos que o numero sorteado para ser o primeiro tenha 
sido o 4. Entao, a amostra seria composta pelo 4° apartamento, 10° 
apartamento, 16° apartamento, 22° apartamento, e assim sucessivamente 
em uma ordem estabelecida. Amostragem por julgamento: esse tipo de 
amostragem acontece quando o pesquisador utiliza seu proprio julga¬ 
mento para selecionar os membros de uma populaqao que oferecem 
boas perspectivas de fornecimento de informaqoes necessarias para a 
sua pesquisa. 

Amostragem por quotas: a amostragem por quotas e realizada quando 
o pesquisador encontra e entrevista um numero predeterminado de pessoas 
pertencentes a cada uma das varias categorias da populaqao. 
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1.1.3 Metodos nao probabilisticos 

Nos metodos nao probabilfsticos, os elementos que irao compor a amos- 
tra sao escolhidos de forma deliberada. Nesses casos, nao e possivel fazer a 
generalizaqao dos resultados obtidos na pesquisa, uma vez que as amostras 
nao probabilfsticas nao garantem a representatividade da populaqao. Vejamos 
alguns casos. 

Amostragem acidental: nesse tipo de amostragem, a amostra e formada 
por aqueles elementos que vao aparecendo, ou seja, que sao possfveis de se 
obter ate completar-se o numero certo de elementos daquela amostra. Temos, 
como exemplo, as pesquisas de opiniao realizadas em praqas publicas, ruas 
do centra das cidades etc. Nesses casos, os entrevistados sao acidentalmente 
escolhidos para compor a amostra. 

Amostragem intencional: esse tipo de amostra e definido pelo pesquisador 
apos ter-se estabelecido um determinado criterio. A partir desse criterio, o 
pesquisador escolhe intencionalmente um grupo de elementos para compor 
a amostra. Entao, o pesquisador, de forma intencional, dirige-se diretamente a 
grupos de elementos dos quais deseja coletar seus dados. Por exemplo, ao rea- 
lizar uma pesquisa a respeito da preferencia por um determinado cosmetico, o 
pesquisador vai intencionalmente a um (ou varios) salao de beleza e entrevista 
as pessoas que ali se encontram naquele momenta. 

Amostragem por quotas: esse metodo de amostragem e muito utilizado 
em pesquisas de mercado e tambem em previas eleitorais. Para se fazer uma 
amostragem por quotas, primeiramente, e necessario realizar a classificaqao 
da populaqao em relaqao a algumas propriedades que podem ser consideradas 
relevantes para os objetivos da pesquisa. Depois disso, e necessario determi- 
nar a proporqao da populaqao de acordo com cada caracterfstica, baseada 
na constituiqao estimada, presumida ou mesmo ja conhecida da populaqao. 
Em seguida, fixamos cotas para cada entrevistador que ficara responsavel por 
selecionar os entrevistados, de forma que a amostra total dos entrevistados 
respeite a proporqao ja determinada anteriormente. Por exemplo, em uma 
pesquisa, desejamos conhecer mais a respeito do trabalho das mulheres no 
mundo moderno. Nessa pesquisa, provavelmente, sera interessante considerar 
varios aspectos, como o trabalho na cidade e no campo, o numero de filhos, a 
idade em que os filhos se encontram etc. Estabelecemos, entao, quotas para que 
cada entrevistador selecione e entreviste o numero de mulheres estabelecido 
em cada classe que deve ser estudada. 
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1 \ 


Atividades de aprendizagem 

1. Observe as situagoes descritas e classifique-as de acordo com o me- 
todo de amostra nao probabilfstico utilizado. 

a) Um estudante cuja curiosidade era verificar os numeros de acessos 
as redes sociais de um grupo de jovens, escolhe entrevistar seus 
colegas de sala de aula. 

b) Para realizar uma pesquisa sobre o interesse das mulheres em re- 
alizar um curso superior no municfpio X, uma empresa verificou 
que, no municfpio em questao, existiam 13.800 mulheres entre 
18 e 45 anos. Ela determinou, entao, que cada entrevistador rea- 
lizaria a pesquisa com 5 mulheres de 18 anos, 4 mulheres de 22 
anos, 3 mulheres de 25 anos, 2 mulheres de 30 anos e 1 mulher 
de 40 anos. 

2. Diferencie a amostragem determinada por metodos probabilfsticos e 
por metodos nao probabilfsticos. 


1.1.4 Cuidados com a amostragem 

Uma boa pesquisa depende bastante da amostra selecionada, que deve 
garantir a representatividade da populagao. Diante disso, para que nao haja 
erros na amostragem, e importante que o pesquisador observe: 

Definigao do universo: a populagao, ou universo, deve ser definida de 
acordo com os objetivos da pesquisa etambem em concordance com o pro- 
blema que se deseja investigar. 

Definigao da unidade da amostra: o pesquisador deve definir, tambem, a 
amostra que sera a base do processo da selegao e investigagao. Por exemplo, 
se deseja que sua amostra seja composta por famflias, entao deve definir bem 
o que vai considerar como famflia e somente entrevistar aqueles que realmente 
se ajustam na definigao de famflia adotada na pesquisa, de forma que outros 
grupos que nao correspondam a definigao pre-estabelecida nao fagam parte 
da amostra. 

Confiabilidade: o rigor metodologico e os cuidados procedimentais e que 
vao garantir, ou nao, a confiabilidadeda pesquisa. 
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Tamanho da amostra: existem varias formulas para se calcular o tamanho 
adequado de uma amostra. Entretanto, devemos sempre levar em conta o 
tamanho de uma populagao. Normalmente, quanto maior for o tamanho da 
amostra (quanto maior for o numero de elementos que compoem a amostra), 
menor serao os desvios dos parametros em relagao ao que se esperava da po¬ 
pulagao. Outro aspecto importante para consideramos e a homogeneidade da 
populagao — quanto mais homogenea for a populagao, menor sera a amostra 
a ser pesquisada. 

Determinando o tamanho da amostra 

Ha tres fatores que determinam o tamanho da amostra: 

_i O grau de confianga adotado. 

j O maximo erro permissfvel. 

j A variabilidade da populagao. 

Dessas consideragoes e que deriva a formula para o calculo do tamanho da 
amostra, nesse momenta considerando populagoes infinitas. 



Na formula anterior, podemos identificar os elementos que determinarao o 
tamanho necessario para que a amostra atenda ao nfvel de confianga desejado 
para as inferences sobre a populagao. 

Para determinarmos, entao, o tamanho da amostra para populagoes infinitas, 
primeiro encontramos o valor de z (grau de confianga adotado) com base na 
tabela de distribuigao normal. Necessitamos do desvio-padrao populacional 
(variabilidade da populagao), que pode ser obtido por estimativa quando nao 
conhecido, e finalmente do erro toleravel (o maximo erro permissfvel), de- 
terminado para o caso em estudo de acordo com a necessidade de precisao 
apresentada. 

Para exemplificar a aplicaqao dessa formula, imaginemos uma empresa 
que deseja analisar a media de consumo de alimentos em seu refeitorio no 
mes de dezembro. Em outros estudos feitos anteriormente, o desvio-padrao de 
consumo foi de 80 gramas. Deseja-se estimar o padrao de consumo com 95% 
de confianqa e com erro admissfvel de 20 gramas. Quantas refeigoes deverao 
ser medidas e anotadas para a analise? Substituindo os valores da formula (7) 
tem-se: 
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= 61,465- o que equivale a aproximadamente 62. 

No exemplo apresentado, seriam necessarias 62 refeiqoes na amostra para 
se determinar o consumo medio na refeiqao durante o mes de dezembro. Essa 
forma de se calcular o tamanho da amostra e aplicada, conforme mencionado, 
nos casos em que a populaqao e infinita, ou seja, nao se tern um limite superior 
definido. 

1.2 Fases da aplica^ao estatistica 

Como em todo metodo, existem fases devidamente identificaveis que per- 
mitem que se obtenha sucesso nos objetivos traqados. A estatistica, conforme 
Fernandes (1999), tern como objetivo fornecer informaqao (conhecimento) uti- 
lizando quantidades numericas. Seguindo esse raciocfnio, de forma resumida, 
pode-se dizer que ela divide o estudo e a analise dos dados (fatos numericos) 
em tres fases: 

1. Obtenqao dos dados. 

2. Descriqao, classificaqao e apresentaqao dos dados. 

3. Conclusoes a tirar dos dados. 

No caso das empresas, foco principal deste capftulo, a obtenqao dos dados 
se da de varias formas. Muitos sao frutos do sistema de informaqao organizado 
pela empresa de acordo com seus objetivos informacionais. Outros sao cole- 
tados via pesquisas de mercado, internamente ou de forma terceirizada, de 
acordo com a finalidade da analise que se deseja. Quando os dados sao tirados 
do proprio sistema informacional da empresa, certamente ha uma economia de 
recursos. Historicamente, o que se faz de forma planejada e antecipadamente 
pensada evita os gastos extraordinarios gerados toda vez que se necessita de 
uma analise de algo sobre o qual nao se tinha um objetivo informacional previo. 

Outra questao importante no processo de obtengao de dados e saber qual 
a quantidade suficiente para cobrir toda a necessidade da analise que se pro- 
cedera. Aproveitar o processo de coleta para atender a real demanda e impres- 
cindfvel para a economia de recursos. Por isso, seja interna ou terceirizada, seja 
planejada ou contingencial, a coleta de dados deve ser muito bem pensada e 
discutida entre os envolvidos no processo. 

Uma vez obtidos os dados, estes passam por um processo denominado des- 
criqao, classificaqao e apresentaqao. A descriqao e a classificaqao referem-se a 
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organizagao e ao tratamento dos dados, de forma a evidenciar inteligivelmen- 
tecada tipo de dado e aquilo que e possfvel ser util para as conclusoes as quais 
se pretende chegar. E nessa fase que se encontram os parametros estatfsticos 
que serao estudados sob o enfoque da estatfstica descritiva. 

Apos a descrigao dos dados, outras tecnicas podem ser empregadas a fim 
de possibilitar um aprofundamento na analise e a descoberta de relagoes entre 
variaveis ou entre fenomenos. 

Exemplo de analise descritiva de dados 

Todos os anos, o INEP realiza o Censo Escolar, que e disponibilizado na 
forma de microdados agrupados por escola; docentes, turma e matriculados. Es¬ 
ses dados tern por objetivo fornecer informagoes estatfsticas e servir de subsfdio 
para a adogao de polfticas e estrategias educacionais. Em 2007, realizou-se um 
levantamento tomando por base os Microdados do Censo Escolar, o qual trouxe 
o numero de alunos matriculados bem como o de aprovados na modalidade 
Ensino de Jovens e Adultos (EJA) de 1 a a 4 a serie registrados no agrupamento 
da escola. Apresentaremos abaixo algumas caracterfsticas da infraestrutura das 
escolas que ofereciam ensino nessa modalidade. A analise de dados abaixo 
tern como objetivo identificar variaveis da infraestrutura ffsica e administrativa 
das escolas que oferecem EJA. 

1.2.1 Descrifao das variaveis selecionadas sobre a escola 

De acordo com os dados, em 2007 o Brasil possufa 81.635 escolas que 
ofereciam a modalidade de ensino EJA (Populagao). 

Comegamos nossa analise trabalhando com a infraestrutura escolar so- 
mente das escolas que tern alunos na quarta serie (Amostra). Vamos fazer uma 
descrigao da infraestrutura ffsica (publica, interna e equipamentos) que essas 
escolas tern. 

Os dados brutos informam que as escolas que possuem alunos na quarta 
serie sao 3.676. Dessas escolas, 828 localizam-se na zona rural e 2.848 na zona 
urbana. Juntas, ela apresentam um total de 36.533 salas de aula e contam com 
68.376 funcionarios. Naquele ano, registraram um total de alunos aprovados/ 
concluintes da quarta serie de 62.715. 

Analisando as informagoes sobre a infraestrutura das escolas (conforme o 
Quadro 1.4), observa-se que a grande maioria das escolas conta com uma boa 
estrutura fornecida pelos servigos publicos. Os destaques sao para a energia eletrica 
fornecida para 98% das escolas, a coleta de lixo em 85% delas, o fornecimento de 
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agua tratada da rede publica que atende 82% das escolas e, por ultimo, destacam- 
-se os serviqos de esgoto, que atendem apenas 56% das escolas pesquisadas. 


Quadro 1.4 Infraestrutura de servigos publicos basicos de que dispoem as escolas com a 
modalidade de ensino EJA de 1 a a 4 a serie 


Tipo 

Escolas que tern 

% do total de escolas 

Agua de rede publica 

3026 

82,32% 

Energia eletrica 

3612 

98,26% 

Provida de esgoto 

2088 

56,80% 

Coleta de lixo regular 

3042 

85,75% 


Fonte: Dos autores (2014). 


O Quadro 1.5 destaca a infraestrutura interna de cada escola, isto e, o que 
e oferecido na escola. Destaca-se que 96% das escolas funcionam em uma 
instalaqao classificada como predio escolar, ou seja, uma construqao destinada 
a abrigar salas de aula. Verificamos que apenas 65,5% das escolas contam com 
sanitarios no proprio predio. 


Quadro 1.5 Infraestrutura interna das escolas com modalidade de ensino EJA de 1 a a 4 a serie 


Tipo 

Escolas que tern 

% do total de escolas 

Predio escolar 

3555 

96,71% 

Sanitario no predio da escola 

2406 

65,45% 

Antena parabolica 

1384 

37,65% 

Quadra de esportes 

1605 

43,66% 

Biblioteca 

1945 

52,91 % 

Acesso a internet 

1750 

47,61 % 

Oferece alimentagao 

3538 

96,25% 

Oferece 5 a serie EJA 

1696 

46,14% 


Fonte: Dos autores (2014). 


Outro destaque e que a maior parte das escolas oferece alimentaqao — 96% 
delas —; ha biblioteca em 52% das escolas, acesso a internet em 47% e quadra 
de esportes em 43%. E em 46% das escolas oferece-se a 5 a serie. 


Quadro 1.6 Equipamentos e recursos das escolas com modalidade de ensino EJA de 1 a a 4 a serie 


Tipo 

Escolas que tern 

% do total de escolas 

Aparelho de televisao 

3088 

84,00% 

Aparelho de video 

2614 

71,11% 

Computador para aluno 

1428 

38,85% 


Fonte: Dos autores (2014). 
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O Quadro 1.6 destaca a existencia de equipamentos na escola. A maior 
parte das escolas possui televisao (84% delas) e aparelho de video (84%). 
Porem, os computadores disponfveis para os alunos sao oferecidosem apenas 
38,8% das escolas. 

1.2.2 Beneficios do uso da estatistica 

Certamente, ao pensar em uma analise complexa — por exemplo, em um 
controle de qualidade de produtos que sao fabricados aos milhoes em uma 
determinada organizaqao, que possuem muitos itens a serem testados e que, 
em muitos casos, necessitam de testes que implicam a destruiqao do elemento 
para a realizaqao da analise —, surgem questionamentos importantes do tipo: 
"Qual a melhor forma de se garantir que haja seguranqa nas afirmaqoes sobre 
a qualidade de um lote de produtos nessas condiqoes?"; "Qual a melhor forma 
de se utilizar o mfnimo de recurso para se obter um resultado eficaz?"; "Qual 
a melhor forma de fazer com que os resultados esperados sejam obtidos no 
menor tempo possfvel?". 

Esses questionamentos sao feitos a todo o momenta no contexto corporativo, 
principalmente diante da situaqao de acirramento da competiqao.Para Stock e 
Watson (2004, p. 39), a estatistica "utiliza dados para entender o mundo que 
nos cerca". Entender o comportamento dos elementos, como, por exemplo, 
dos integrantes do fluxo de caixa da empresa, representa uma parte importante 
do planejamento estrategico de uma entidade que poderia gerar, quern sabe, 
mais rapidez e economia nesse processo. A utilizaqao dos metodos estatfsticos 
mostra-se eficaz nessas situaqoes, justificando sua utilizaqao devido, principal¬ 
mente, aos seguintes fatores: 

1.2.2.1 Rapidez e precisao nas respostas aos problemas 

O fator tempo, atualmente, e um recurso muito valorizado no meio cor¬ 
porativo. A cada dia, a velocidade das informaqoes torna-se um diferencial 
importantfssimo, influenciando e, muitas vezes, determinando a continuidade 
de um negocio. Por outro lado, a ansia pela velocidade pode acarretar o pre- 
jufzo da qualidade da informaqao. Tanto quanto rapidas, elas necessitam ser 
corretas, precisas. E a relaqao fundamental de tempestividade e precisao. A 
partir da utilizaqao de metodos estatfsticos adequados, corretamente escolhi- 
dos e modelados antes da aplicaqao pratica, torna-se possfvel a obtenqao de 
informaqoes tempestivas e precisas. 
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1.2.2.2 Descentralizagao 

O paradoxo da descentralizagao das informagoes em relagao a evolugao dos 
sistemas a partir de sua estruturagao em bancos de dados — que centralizam 
o armazenamento das informagoes a serem processadas —, e uma realidade 
nas empresas que romperam seus limites regionais. A busca por processamen- 
tos descentralizados, mesmo a partir de dados centralizados, e uma verdade. 
Empresas com filiais, sucursais, join-venture , parceiras e afins beneficiam-se 
ao possibilitarem que determinadas operagoes sejam executadas de forma 
descentralizada. Isso contribui para a rapidez discutida no item imediatamente 
anterior. Nesse sentido, esse beneffcio refere-se a possibilidade de que pessoas, 
nem sempre detentoras de conhecimentos profundos em estatistica, possam 
executar tarefas de analise no exato local onde se encontram. A descentrali¬ 
zagao pode contribuir para a dissipagao do conhecimento de determinados 
processos de analise quantitativa, refletindo positivamente na cultura de con- 
trole da organizagao. 

1.2.2.3 Maior possibilidade de testes antes de decisoes importantes 

Quanto custaria para uma empresa de fabricagao de caixas-d'agua de gran- 
des proporgoes verificar a eficacia do concreto apos este estar parcialmente 
aplicado e em processo de secagem? Certamente, seria um desastre economico 
e financeiro. 

Para esse tipo de procedimento, a aplicagao dos conceitos da estatistica 
torna-se eficaz para que, por meio dos procedimentos adequados, possam-se 
executar tantos testes quantos forem necessarios, ate que se tenha a garantia 
probabilisticamente calculada de que aquele material atingira satisfatoriamente 
seus objetivos. 

Os metodos estatfsticos de analise por amostragem possibilitam a reapli- 
cagao de testes em fragmentos estatisticamente significantes, de tal forma que 
a repetigao nao comprometa o todo, permitindo a antecipagao de possfveis 
problemas que uma ma analise de qualidade poderia proporcionar. 

1.2.2.4 Economia de recursos 

Diante da realidade de que as empresas estao operando com recursos cada 
dia mais escassos — portanto, mais dispendiosos —, a sua economia, sejam 
tais recursos materiais, humanos ou financeiros, e imprescindfvel. 
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A pressao imposta pela competitividade e pelo "amadurecimento" da de- 
manda, que impoe restrigoes as polfticas de pregos, praticamente obriga as 
empresas a buscar alternativas de contengao. 

Recuperando o exemplo do topico anterior da empresa de caixas-d'agua, a 
possibilidade de, por meio de processo de amostragens, a empresa poder inferir 
opiniao sobre um todo e, certamente, uma forma de se economizar tempo e 
dinheiro, alem de se diminuir a utilizagao de recursos humanos necessarios no 
caso de uma analise mais ampla para obter o mesmo resultado. 

E importante ressaltar que a economia de recursos de qualquer ordem, como 
resultado da aplicagao dos metodos estatisticos, representa algo que nao pode 
interferir na seguranga da analise em curso, ou seja, vale a pena a revisao cons- 
tante da adequagao dos procedimentos identificados, modelados e aplicados. 
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Caro aluno, nos dias de hoje, para quase todos os processos que envolvem 
o trabalho com numeros, dados e informaqoes em geral, foram desenvolvidos 
instrumentais ligados aos desenvolvimentos de softwares e informatizaqao. 

O mesmo ocorre com a Estatfstica: foram desenvolvidos softwares mais 
avanqados, como Minitab, SPSS e Stata, e tambem outros recursos mais tradi- 
cionais, como os elaborados pela Microsoft no Excel. 

Enfim, todos esses instrumentais tanto ampliaram quanto tornaram mais 
praticas as atividades de analise de dados, pois permitem realizar diversas 
mediqoes estatfsticas alem da criaqao de graficos, tomando por base os dados 
levantados em uma pesquisa. 

Tendo em vista que para voce, aluno, no ambiente corporativo, a ferramenta 
mais prontamente disponfvel e o Excel, vamos, entao, estudar um pouco mais 
sobre essa ferramenta e suas aplicaqoes estatfsticas. 

2.1 No^oes de estatistica com o uso do Excel 

Com a informatizaqao, a aplicaqao dos metodos estatfsticos vem se tor- 
nando mais simples, rapida e eficaz. Focando os beneffcios da aplicaqao desses 
metodos no meio corporativo, pode-se dizer que e possfvel, para as empresas, 
desenvolver inumeros tratamentos de dados, bastando para isso dispor, por 
exemplo, de uma planilha eletronica — como o Excel da Microsoft. 



Questdespara reflexao 


Sera que somente o uso da tecnologia resolve o problema em termos 
decisorios nas empresas? Estaria o profissional realmente ameaqado 
pelo computador no que se refere a analises e tomadas de decisao? 


Existem outros softwares que possibilitam a aplicaqao via planilha ele¬ 
tronica, mas o Excel ainda e o mais conhecido. Alem das planilhas, algumas 
calculadoras, tanto financeiras quanto cientfficas, possuem funqoes estatfsticas. 

Apesar de as planilhas e calculadoras estarem cada dia mais evolufdas, ao 
menos outras duas formas de automatizaqao sao bastante eficazes: os suple- 
mentos para planilhas eletronicas, que automatizam funqoes especfficas, e os 
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softwares especializados. Certamente, de todas as opgoes, os softwares sao os 
mais completos e robustos para as aplicagoes estatfsticas. 

Com uma simples pesquisa na internet, e possfvel encontrar qualquer uma 
dessas formas de automatizagao das fungoes estatfsticas. Existem, inclusive, 
aplicagoes sem custo para o usuario. Devido ao fato de que a maioria dos com- 
putadores, tanto os desktops quanto os notebooks, possui o sistema operacional 
Windows® com o pacote Office®, no qual consta a planilha Excel®, essa sera 
a opgao para o desenvolvimento dos exercfcios presentes neste capftulo. 

Para que se habilite o programa para as fungoes que serao trabalhadas ao 
longo do capftulo, algumas operagoes deverao ser desenvolvidas antecipada- 
mente, conforme pode ser visto no Quadro 1.7. Nele, e possfvel observar o 
primeiro procedimento de preparagao do software. O usuario deve habilitar 
alguns suplementos que sao similares a uma biblioteca de fungoes que ficam 
desabilitadas na instalagao normal — isso se deve, principalmente, a economia 
do uso de memoria do computador. 

Para isso, o usuario deve clicar com o botao direito do mouse sobre a barra 
de ferramentas do Excel 2007 e marcar a opgao "Personalizar Barra de Ferra- 
mentas de Acesso Rapido" (Parte A). Isso abrira a janela "Opgoes" do Excel. 
Nesta, ele marcara a opgao "Suplementos" e, nas opgoes de suplementos, 
marcara a opgao "Ferramentas de Analise —VBA"; na opgao abaixo onde 
aparece "Gerenciar", devera escolher a opgao "Suplementos do Excel" e clicar 
em "Ir" (Parte B). Sera aberta outra janela "Suplementos", e ele devera marcar 
as opgoes "Suplemento de Analise" e "Suplemento de Analise —VBA"(Parte 
C); ao clicar em OK, as ferramentas serao instaladas na barra de ferramentas 
quando voce acessar a aba "Dados", ficando disponfvel do lado direito da tela 
em "Analise de Dados" (Parte D). 

Quadro 1.7 Telas de habilitagao de suplemento software Excel 2007 
Parte A 
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Parte B 



Parte C 
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Parte D 



NUMJlii tr.iUn- 

■nw r* M¥ ». i r» 
3:ai I -it « ic ui 

mf IWI 

3 • bj r ■ ■ Vi J 


Fonte: Dos autores (2014), 


Vale lembrar que a forma de habilitaqao dos suplementos pode variar de 
acordo com a versao do software que se estiver utilizando. Nesse caso, aconse- 
Iha-se a pesquisa nos manuals ou menus de ajuda do fabricante. As ferramentas 
habilitadas serao uteis para a automatizaqao das analises estatfsticas dos dados, 
incluindo a possibilidade de automatizaqao do processo de amostragem, que 
sera tratada em momenta oportuno. Uma vez habilitados esses suplementos, o 
software disponibiIizara as opqoes de analise de dados, que serao conhecidas 
a medida que houver a necessidade e que exercfcios referentes a cada topico 
sejam solucionados. A partir do uso da informatica, e possfvel a agilizaqao dos 
processos conforme foi demonstrado. Existem materials bibliograficos especfficos 
para orienta-lo sobre como utilizar esses recursos tecnologicos. 


Para saber mais 

Para estudar mais sobre informatizagao e estatistica, voce pode ler o Capitulo 1, "Introdugao 
ao Excel", do livro Estatistica aplicada a administragao usando o Excel, do autor John L. 
Neufeld, publicado em 2003. 



Pois bem. Agora que voce compreende um pouco melhor o uso do Excel, 
podemos propor algumas atividades basicas. Vamos a elas. 


Atividades de aprendizagem 


1. Os dados abaixo representam o consumo de energia eletrica rural no 
estado do Parana para os anos de 1999 a 2012. Observe os dados e 
faqa o que se pede: 
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Ano 

Energia eletrica rural — consumo (Mwh) 

1999 

1.098.565 

2000 

1.145.548 

2001 

1.153.589 

2002 

1.233.387 

2003 

1.268.096 

2004 

1.339.693 

2005 

1.409.379 

2006 

1.452.764 

2007 

1.545.217 

2008 

1.630.900 

2009 

1.706.287 

2010 

1.801.680 

2011 

1.899.936 

2012 

2.054.625 


a) No Excel, copie os dados da tabela. 

b) Crie graficos: um de linha e outro de barra. 

2. Os dados a seguir referem-se ao numero de trabalhadores no setor 
agropecuario do Estado do Parana para os anos de 2000 e 2010. 
Observe os dados e faqa o que se pede: 


Tamanho do estabelecimento de acordo com o 
numero de empregados 

Emprego total 
2000 

Emprego total 
2010 

ATE 4 

303.111 

380.709 

DE 5 A 9 

141.557 

194.085 

DE 10 A 19 

121.890 

173.309 

DE 20 A 49 

134.081 

176.925 

DE 50 A 99 

83.093 

119.945 

DE100 A 249 

88.129 

123.950 

DE 250 A 499 

53.661 

72.883 

DE 500 A 999 

62.934 

76.918 

1000 OU MAIS 

83.815 

90.873 

Total 

1.072.271 

1.409.597 


a) Copie os dados para o Excel. 

b) Crie uma terceira coluna para calcular quanto cresceu o emprego 
de 2000 para 2010. 

c) Crie um grafico de barras comparando os dois anos. 
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Segao 3 


Organiza9ao e defla^ao de dados 


Nesta segao, vamos nos ocupar em entender como se faz a organizagao de 
dados, isto e, para que nos utilizemos de dados, e necessario que, antes, sejam 
tornados alguns procedimentos previos, pois sao estes que vao fazer com que 
os dados levantados em uma pesquisa passem a fazer sentido ou permitam 
atingir um objetivo. Nesse sentido, cabe aqui uma pequena explanagao sobre 
os passos para a realizagao de uma pesquisa experimental. Vamos estuda-los. 


3.1 Sugestao de roteiro para as pesquisas descritiva e 
experimental 

Escolha o assunto: devemos escolher um assunto significativo, relevante e 
adequado tanto aos interesses do pesquisador quanto aos interesses da comu- 
nidade academica ou cientffica, de acordo com o nosso nfvel de formagao e 
tambem com as condigoes do pesquisador. 

Titulo da pesquisa: o titulo deve deixar claro qual o tema que esta sendo 
trabalhado. 

Delimitagao do assunto: sao muitos os assuntos que podem ser abordados; 
entretanto, as vezes eles sao muito amplos. Assim, devemos selecionar um 
topico para ser estudado de acordo com sua profundidade, de forma que seja 
viavel de ser pesquisado. Devemos evitar temas amplos, pois eles podem tornar 
os trabalhos superficiais. 

Objetivos: para os objetivos, devemos esclarecer o que pretendemos al- 
cangar com a pesquisa. 

Justificativa da escolha: nesse ponto, devemos explicitar as razoes da pre¬ 
ference pelo assunto escolhido, ou seja, porque resolvemos estudar esse tema 
e, principalmente, qual e a sua importance em relagao a outros temas. 

Revisao da literatura: nessa etapa, devemos realizar uma pesquisa bibliogra- 
fica referente ao assunto e a questao delimitada. Esse estudo teorico tern como 
objetivo evidenciar os trabalhos ja realizados a respeito do assunto, apresentar 
as informagoes sobre a situagao atual do problema pesquisado e tambem ex¬ 
plicitar as opinioes existentes. Essas informagoes sao importantes para auxiliar 
o pesquisador nas tomadas de decisao. 

Formulagao do problema: o problema deve ser formulado de forma clara, 
precisa e objetiva e deve ser uma questao cuja solugao viavel possa ser alcan- 
gada pela pesquisa. Para elaborarmos um problema de forma clara, e necessaria 
muita leitura e a revisao da literatura exposta no item anterior. 
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Enunciado da hipotese: a hipotese consiste em uma resposta antecipada ou 
uma explicaqao provisoria do que o pesquisador enuncia. Em outras palavras, 
a hipotese e a soluqao que o pesquisador acredita. Ela deve ser colocada a 
prova e responder o problema levantado. 

Defini^ao operacional das variaveis: a hipotese vai orientar a execuqao da 
pesquisa. Dessa forma, os termos empregados na hipotese devem esclarecer, da 
melhor maneira possfvel, o que eles significam no contexto concreto e objetivo 
da pesquisa a ser realizada. 

Amostragem: muitas vezes, ou melhor, na maioria delas, e diffcil para o 
pesquisador trabalhar com a totalidade de seus elementos, ou seja, com toda 
a "populaqao" ou "universo". Podemos compreender a populaqao como um 
conjunto de pessoas, animais ou objetos que representam a totalidade de 
indivfduos que possuem as mesmas caracterfsticas definidas para um estudo. 
Geralmente, como nao temos acesso a toda a populaqao, podemos realizar a 
pesquisa com uma parte representativa da populaqao, denominada "amostra", 
e nao com a totalidade dos indivfduos. Dessa forma, podemos compreender 
a amostra como sendo uma parte da populaqao selecionada de acordo com 
uma tecnica de amostragem que garante sua representatividade. 

Instrumentos de pesquisa: sao os instrumentos utilizados pelo pesquisador 
para a coleta de dados, que podem ser bem variados: entrevista, questionario, 
formulario, mediqoes etc. Quando a pesquisa realizada tern carater experimen¬ 
tal, entao sao descritos os instrumentos, materials ou tecnicas a serem usados. 

Procedimentos: nessa etapa, e necessario realizar a descriqao detalhada de 
todos os passos da coleta e registro dos dados: quern participou da pesquisa, 
onde foi realizada, quando, quanto tempo durou etc. Podemos, ainda, des- 
crever as dificuldades encontradas no decorrer da pesquisa, as precauqoes, a 
supervisao e o controle. 

Analise dos dados: apos a coleta dos dados, e necessario realizar a analise 
dos mesmos. Os resultados da analise podem ser expostos em tabelas, de forma 
sintetica, e submetidos ou nao (de acordo com cada pesquisa) a um tratamento 
estatfstico mais profundo em que todas as informaqoes reunidas nos passos 
anteriores sao comparadas entre si e analisadas. 

Discussao dos resultados: nessa etapa, explicitamos a generalizaqao dos 
resultados obtidos por meio da analise realizada. Nessa discussao, o pesqui¬ 
sador faz as inferences e generalizaqoes pertinentes com base nos resultados 
alcanqados. Os resultados obtidos tambem sao discutidos e comparados com 
afirmaqoes e posiqoes de outros autores investigados pelo pesquisador. 


5 25 


50 


75 100 











96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:27 - June 30, 2014 - PG-38 


30 METODOS QUANTITATIVOS 

Conclusao: na conclusao, devemos apresentar um resumo dos resultados 
mais significativos e relevantes da pesquisa e indicar se esses resultados auxiliam 
na comprovaqao ou rejeiqao da hipotese de estudo ja apresentada. Tambem e 
o momenta do pesquisador indicar quais os possfveis desdobramentos de sua 
pesquisa, ou seja, quais os aspectos que podem ser estudados e aprofundados 
em outros estudos. 

Bibliografia: o pesquisador deve citar, de acordo com normas proprias, 
as references bibliograficas que serviram de embasamento para o seu estudo 
teorico. 

Pois bem. Como vimos, os passos da pesquisa sao importantes porque nos 
direcionam para atingir o objetivo e tambem preparam o caminho para que se 
possa escrever o relatorio dessa pesquisa. Assim, os itens analise de dados, dis- 
cussao de resultados, conclusao e bibliografia fazem parte de qualquer relatorio 
de pesquisa, assim como os itens anteriores de tftulo, introduqao, justificativa, 
problema, revisao de literatura etc. Mas um item das etapas de pesquisa que 
e indispensavel e a fase de analise de dados, cuja pre-condiqao e que estes 
tenham sido agrupados ou modelados de alguma forma. Assim, precisamos ver 
como os dados podem ser organizados. 

E o que vamos estudar no proximo item. 

3.2 Organizando e modelando os dados 

Pois bem. Apos a realizaqao do planejamento da pesquisa, e necessario 
definir de que maneira vamos levantar as informaqoes necessarias, quais sao 
os dados que devemos coletar, que tipo de amostra devemos usar, qual e o 
cronograma das atividades etc. 

A coleta de dados se caracteriza por ser pratica ou operacional. Nela, 
fazemos o registro sistematico de dados obtidos por meio da coleta, com um 
objetivo pre-estabelecido. Podemos ter alguns tipos de dados: 

j dados primarios: quando o pesquisador utiliza e publica os dados que 
ele mesmo ou sua organizaqao coletou, como, por exemplo, os dados 
do censo demografico do IBGE. 

_l dados secundarios: sao dados publicados por outro tipo de organizaqao, 
como, por exemplo, quando um jornal publica estatfsticas obtidas pelo 
IBGE. Uma observaqao importante e que e sempre mais seguro utilizar 
fontes primarias. O uso de fontes secundarias pode provocar o risco de 
erros de transcriqao. Nesse caso, podemos fazer uma coleta direta, isto e, 
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obter os dados diretamente da fonte, como, por exemplo, uma empresa 
que realiza uma pesquisa para observar qual a preferencia dos consumi- 
dores em relaqao a sua marca de produtos. 

Apos a coleta de dados, podemos entrar na fase de apuragao dos dados. De 
posse dos dados obtidos, os mesmos sao contados e agrupados por meio da 
tabulaqao dos dados. Essa fase tambem e chamada de tabulaqao de dados; ela 
indica que os dados estao sendo agrupados de alguma forma para que possam 
ser apresentados e utilizados na pesquisa. Na apresentagao dos dados, pode-se 
optar por uma apresentaqao tabular, na qual os dados sao apresentados em 
sua notaqao numerica, organizados em linhas e colunas ou, ainda, na forma 
grafica em que os dados sao apresentados de forma geometrica, que permite 
uma visualizaqao rapida e uma compreensao clara do fenomeno estudado. 

3.2.1 Modelando os dados 

A medida que uma determinada situaqao exija um tratamento estatfstico, 
repetindo-se costumeiramente, sera importante que haja uma customizaqao 
desse processo a ponto de automatiza-lo e torna-lo padronizado. 

Todo o processo de analise estatistica pressupoe que haja o respeito a 
sequencia apresentada na seqao anterior, ou seja: obtenqao dos dados; des- 
criqao, classificaqao e apresentaqao dos dados e conclusoes sobre os dados. 

Voce vera que essas etapas sao representadas por metodologias capazes 
de dar sentido e garantir a inteligibilidade dos dados bem como das analises. 
Metodologias, como os numeros indices, tabulaqao, elaboraqao de graficos 
etc., compoem o conjunto de elementos que tornam o tratamento estatfstico 
algo consistente e, sobretudo, didatico. 

A analise previa da necessidade informacional que o usuario pretende a 
partir da situaqao objeto e o que determinara os tipos de ferramentais estatfsti- 
cos a serem utilizados e, num segundo momento, automatizados, devendo ser 
sugerida a criaqao de um modelo para ser utilizado quantas vezes se desejar 
executar a analise. A repetiqao podera significar, inclusive, aperfeiqoamento 
dos modelos usados a medida que se permita a contribuiqao pratica e teo- 
rica dos envolvidos. 

Modelo e uma "representaqao simplificada da realidade, estruturada de 
forma tal que permita compreender o funcionamento total dessa realidade ou 
fenomeno" (MATOS, 1995, p. 20). 
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Em resumo, denomina-se modelagem estatfstica o processo de identificaqao 
dos procedimentos adequados para se efetuar o tratamento dos dados de forma 
a atender a necessidade de informaqao do analista. Para que haja confiabilidade 
na aplicaqao de um modelo estatistico, alguns princfpios devem ser respeitados: 

j Deve possuir uma teoria de sustentaqao; 

j Deve ser "inteligfvel" para seus usuarios; 

j Deve possuir uma metodologia adequada em termos de complexidade 
e extensao; 

j Deve possibilitar a terceiros sua replicaqao como forma de confirmaqao 
ou refutaqao das respostas apresentadas. 



Voce acha que um calculo estatistico que seja feito apenas para pes- 
soas formadas em estatfstica entenderem atinge seu objetivo? Por que? 


A resposta a questao proposta talvez o ajude a entender a importancia da 
modelagem, ja que ela proporciona inteligibilidade as aplicaqoes estatfsticas. A 
modelagem pressupoe, em segunda analise, a possibilidade de automatizaqao, 
o que agilizara futuros tratamentos e permitira que os calculos sejam feitos por 
outros profissionais, proporcionando a socializaqao da informaqao. 

Ela contribui, entao, para o tratamento dos dados e para o acesso as analises 
ao longo do tempo. Existem alguns tipos de analises feitas a partir do tratamento 
dos dados. Geralmente, eles variam em relagao aos aspectos: profundidade da 
analise e nfvel de estudo da relaqao entre as variaveis envolvidas. 

Sob o aspecto da profundidade, quanto mais complexa for a analise, mais 
desejavel se torna a aplicaqao de modelos. Isso tambem ocorre no que se refere 
a busca do conhecimento sobre o relacionamento entre variaveis. Uma vez 
estabelecida essa relaqao, o modelo podera contribuir para a automaqao de 
previsoes, por exemplo. 

3.2.1.1 Tabulagao 

Tabulaqao e a fase que ocorre apos a coleta dos dados para analise e pressu¬ 
poe que se saiba antecipadamente seus objetivos. A antecipaqao dos objetivos 
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de analise e o que evitara, por exemplo, trabalhos desnecessarios e perda de 
tempo e de recursos financeiros ao longo de sua pesquisa ou analise gerencial 
dentro da empresa. 

Antes de serem tabulados, os dados coletados representam meros numeros 
ou aspectos qualitativos soltos e de diffcil interpretaqao. Ao se tabular, cumpre- 
-se um primeiro passo para tornar esses dados mais inteligfveis e analisaveis. 

A expressao visual de um dado ou informaqao e certamente uma das for¬ 
mas mais eficazes, em termos didaticos, para que sejam captadas as nuances 
contidas neles. Essa percepqao visual melhora a compreensao do analista e dos 
usuarios do objeto em analise, alem de representar uma forma bastante eficaz 
de organizaqao e recuperaqao de informaqoes relevantes. 

O que voce pode entender, entao, por tabulaqao? Lembre-se: a tabulaqao 
e a sistematiza^ao dos dados coletados para a analise, de forma a torna-los 
organizados e i ntel igfveis, possibilitando a execuqao do tratamento necessario 
para que sejam atingidos os objetivos previamente traqados. 


V 


Atividades de aprendizagem 


1. Veja no exemplo do quadro a seguir que, apos a tabulaqao, ja e possf- 
vel uma analise, mesmo que superficial, dos dados. Isso se da devido 
a sua organizaqao de acordo com os objetivos. Que conclusao voce 
poderia tirar dos dados apresentados no Quadro 1.8? 


Quadro 1.8 Dados hipoteticos 
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2 . Quando os valores de uma observagao se repetem, e possfvel fazer 
uma tabulagao agrupando os dados de acordo com sua frequencia, 
isto e, agrupando o numero de vezes que aparece. Vamos imaginar 
que uma empresa X realizou uma pesquisa sobre a satisfagao dos 
clientes em relagao ao atendimento recebido e, para poder quantificar 
essas informagoes, solicitou que eles associassem notas a graus de 
qualidade do atendimento recebido. Assim, quando o atendimento 
era otimo, a nota era 5, quando era bom, 3, quando regular, 1 e, para 
ruim, 0. Ao conferir as notas atribufdas a empresa, deparou-se com 
os seguintes numeros: 0, 3, 1, 1, 3, 5, 1, 0, 0, 1, 3, 5, 3, 1,0, 5, 3,3. 
Observando esses dados, complete a tabela. 


Tabela 1.1 Satisfagao dos clientes da empresa X 


Conceito 

Nota 

Frequencia 

Otimo 

5 


Bom 

3 


Regular 

1 


Ruim 

0 



Com base nos dados tabulados na tabela, como foi classificado 
o atendimento da empresa de acordo com as notas atribufdas 
pelos clientes? 


3.3 Deflacionando dados: numeros-mdices 

Os numeros-mdices sao medidas usadas para comparar grupos de variaveis 
que possuem algum relacionamento entre si, de tal forma que seja possfvel a 
obtengao de um quadro organizado dos comportamentos das variaveis dentro 
desse grupo selecionado, como, por exemplo: variagao de prego do produto A 
num determinado espago de tempo, ou uma comparagao do produto A com o 
produto B em termos de prego em um determinado perfodo de tempo. Tambem 
chamado de deflacionamento de dados. 

Pode ser definido como um instrumento estatfstico utilizado por varias 
areas, como administragao, economia, contabilidade, engenharia etc., para 
fazer comparagoes de alteragoes em variaveis especfficas num dado espago de 
tempo. Geralmente,tratam-se de variaveis como prego, quantidades, volume 
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de produgao etc. de um elemento qualquer ou de varios elementos tornados 
para comparagao. 

Se voce esta diante de uma analise, por exemplo, de capacidade de poder 
de compra envolvendo o salario da populagao, certamente utilizara numeros- 
-fndices como forma de comparagao. 

Os numeros-fndices utilizados em estatfstica contribuem para as analises, 
principalmente comparativas, de perfodos. O fndice de pregos ao consumidor 
(IPC), por exemplo, contribui para que se possa fazer uma analise historica da 
variagao de pregos de varios itens da cesta basica de consumo da populagao. 
Como se poderia fazer essa comparagao sem a padronizagao dos itens que 
compoem o fndice e sem traze-los para uma mesma unidade de analise, nesse 
caso podendo ser a variagao percentual de um perfodo para outro? 

Os numeros-mdices, ao se referirem a um unico elemento sendo comparado 
em perfodos distintos, sao denominados numeros-fndices simples. Ao envolver 
mais de um elemento, os numeros-fndices sao denominados compostos. 

E comum a aplicagao desse tipo de metodologia em calculos economicos, 
como pode-se verificar na citagao a seguir: 

A teoria dos numeros-fndices possui duas ramificagoes 
no que diz respeito ao numero de perfodos ou de re- 
gioes a serem comparados: numeros-fndices bilaterais, 
quando o numero de unidades economicas e igual a dois, 
e numeros-fndices multilaterais, quando esse numero e 
superior a dois (AZZONI; CARMO; MENEZES, 2003, p. 4). 

E possfvel verificar, portanto, que existem outras classificagoes possfveis (bi¬ 
laterais e multilaterais) no que se refere aos numeros-fndices; porem, basta para 
os objetivos desta unidade o entendimento sobre seu conceito e aplicabilidade. 
Para verificar uma aplicagao de numeros-fndices, recorremos a um exemplo: 

CASO I: Corregao Monetaria 

Em setembro de 2007, uma pessoa realizou um emprestimo de R$ 90,00 
em um banco. Passados tres meses, essa pessoa resolveu suspender os paga- 
mentos, apresentando na justiga sua inconformidade com o valor a ser pago. 
A disputa judicial prosseguiu 5 anos. Ao final, chegou-se a um acordo em que 
o cidadao deveria pagar a dfvida corrigida pelo IGP-M. 
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Solugao 

Nesse caso, a dfvida esta sujeita a correqao monetaria como forma de 
atualizar o seu valor. A forma de realizar esse calculo e dividir o indexador do 
perfodo atual pelo indexador do perfodo base. 

Entao, se em setembro de 2007 (perfodo base), o IGP-M foi 871,11, e em 
setembro de 2007 (perfodo atual), o mesmo fndice chegou a 1.273,27, a cor- 
reqao monetaria podera ser realizada multiplicando-se o valor base ou inicial, 
R$ 90,00, pelo resultado da divisao dos indexadores (1,4616), o que dara um 
valor corrigido de R$ 131,54. 

Formula 

Valor corrigido = (fndice atual / fndice base) x valor base 

CASO II: Deflacionamento 

Podemos imaginar, partindo da situaqao anterior, que a sentenqa tivesse 
ordenado que fosse pago apenas o valor devido, ou seja, R$ 90,00. Tendo em 
vista que durante todo esse tempo houve inflaqao, entao gostarfamos de saber 
qual foi o valor real, isso e, o valor pago, descontada a inflaqao. 

Soluqao 

Nesse caso, estaremos realizando uma operaqao inversa a do caso I. Assim, 
a fim de eliminar o efeito da inflaqao, dividimos o valor monetario do perfodo 
atual pelo valor obtido da divisao entre o indexador do perfodo atual pelo 
indexador do perfodo. Tomamos R$ 90,00 e dividimos por 1,4646 e teremos 
o valor de R$ 61,45. Esse valor final representa que, caso o cliente pagasse R$ 
90,00 hoje, contrafdos ha cinco anos, o valor verdadeiro do pagamento seria 
apenas R$ 61,45. Na pratica, seria o mesmo efeito de ter contrafdo R$ 61,45 
em emprestimo e pago R$ 90,00, considerando a inflaqao. 

Formula 

Valor deflacionado = valor base / (fndice atual / fndice base) 

Nos graficos a seguir, voce pode visualizar o que ocorre quando os valores 
nominais (linha com marcaqao quadrado) sao deflacionados (linha com mar- 
caqao losango). No Grafico 1.1, os valores foram deflacionados. Isso significa 
que todos os valores nominais foram transformados em valores reais para o 
ano de 1999=100. No Grafico 1.2, o valores nominais foram inflacionados. 
Isso significa que os valores foram transformados em valores reais para o ano 
de 2013 = 100. 
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Grafico 1.1 Exemplo de valores reais deflacionados 
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Fonte: Dos autores (2014). 


Grafico 1.2 Exemplo de valores reais inflacionados 
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Fonte: Dos autores (2014). 


3.4 Um pouco sobre inferencia estatistica 

E a aplicaqao de tecnicas estatisticas segundo determinados princtpios e 
criterios validos, de forma a permitir a extrapolaqao das analises feitas de uma 
amostra para o todo. Implica, geralmente, a conclusao sobre causa e efeito de 
determinadas variaveis. 

A inferencia pressupoe que os resultados obtidos na amostra sejam passfveis 
de ser extrapolados para toda a populaqao em estudo. Portanto, exige que se¬ 
jam utilizadas tecnicas cientfficas para a determinaqao da amostra que servira 
como objeto de analise do todo. 
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Nao ha inferencia estatfstica sem o pressuposto da adequaqao dos metodos 
utilizados, ou seja, novamente se destaca a importancia de que os modelos 
sejam construidos a partir de um minucioso estudo das caracterfsticas do objeto 
em estudo, de tal forma que as tecnicas a serem utilizadas possam ser identi- 
ficadas adequadamente. Um erro nesse processo implica outro na inferencia. 

O processo inferencial tambem pode ser classificado como indutivo, uma 
vez que parte de uma amostra para o entendimento do todo — o que possibilita 
economia de recursos para as empresas, conforme ja mencionado anterior- 
mente. O processo indutivo e menos agressivo para a populaqao analisada, 
principalmente no caso de esta, por exemplo, referir-se as analises materials 
de qualidade. 

Como seria a remoqao de todos os tijolos de uma olaria para um teste de 
qualidade em laboratorio? O Quadro 1.9 demonstra a relaqao da estatfstica 
inferencial com a amostra e a populaqao estudada. 


Quadro 1.9 Rela^ao popula^ao amostragem e inferencia 


/ 


Popula^ao 


\ 


V 


/ 


/ 


Amostragem 




( Amostra ) 

v y 


Inferencia estatfstica 


Fonte: Dos autores (2014). 


Para que voce visualize o conteudo exposto nessa unidade de forma pratica, 
e apresentado na sequencia um exemplo simplificado no qual se retoma cada 
uma das subseqoes discutidas. 
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Imagine a seguinte situa^ao: 

A empresa Analisando Ltda. pretende saber o grau de satisfaqao de seus clien- 
tes. Ela dispoe para tanto de uma populaqao, e claro. Qua! seria essa populacao! 

Para responder a essa questao, o dono da empresa chamou o senhor Mente 
Aberta, um funcionario de seu primeiro escalao e que recentemente fez um 
curso sobre estatfstica aplicada. 

O dono da empresa apresentou ao senhor Mente Aberta sua primeira 
questao — qual seria a populaqao a ser analisada? —, que foi respondida da 
seguinte forma: 

A POPULACAO: o conjunto de todos os clientes que ja consumiram os 
produtos da empresa Analisando Ltda. Veja que a populaqao foi claramente 
definida pelo funcionario, inclusive em seus detalhes. Isso e muito importante 
quando se pretende fazer uma analise estatistica. 

Agora e o senhor Mente Aberta que dialoga com o dono da empresa: 

O primeiro passo para que consigamos chegar a um bom resultado, o senhor 
ja deu, ou seja, definiu o que deseja a partir da analise da populacao. 

"Saber o grau de satisfaqao de nossos consumidores". Para nosso segundo 
passo, e necessario, entao, que facamos uma amostragem, pois seria impossfvel 
entrevistarmos todos os nossos clientes. Sao muitos. Eu sugiro, entao, que, do 
total de nossa populaqao, analisemos 20%, pois, pelos meus calculos, e essa a 
quantidade que nos garantira significancia estatistica para a amostra. 

Como voce viu, o senhor Mente Aberta esta preocupado com outro fator 
muitfssimo importante para a estatfstica aplicada, ou seja, a significancia es¬ 
tatistica da amostra. 

Bern! Para chegar, entao, a amostra de20%, o senhor Mente Aberta solicitou 
ao departamento de vendas a relaqao dos clientes que a empresa atende regu- 
larmente. Esse relatorio contou com 150 clientes. Entao, qual seria a amostra? 

AMOSTRA: a amostra, segundo determinou o funcionario da empresa, 
e calculada, portanto, a partir da aplicaqao de 20% sobre a populaqao de 
150 clientes. Dessa forma, a amostra sera de 30 clientes. 

A partir desse segundo passo importante, ja e possfvel, entao, definir-se 
todos os elementos fundamentais para a aplicaqao da analise estatistica. Veja 
o Quadro 1.10 e relacione com os conceitos vistos na unidade anterior. 
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Quadro 1.10 Defini^oes para os parametros estatisticos no exemplo 


ELEMENTO 

IDENTIFICAgAO 

Populagao ou universo 

Todos os clientes que compraram na empresa e que se pretendem 
pesquisar. 150 clientes. 

Elementos ou unidades 

Cada um dos clientes representa um elemento ou unidade. 

Amostra 

A porpao de clientes que sera entrevistada e definida no exemplo 
como 20% da populagao, o que equivale a 30 clientes. 

Variavel 

A caracterfstica especi'fica que se pretende analisar da populagao ou da 
amostra. No caso, o fndice de satisfacao. 

Fonte: Dos autores (2014). 


Antes de avangarmos no exemplo, e importante destacar que o proprio 
termo "fndice de satisfagao" remete a um outro conceito estudado, ou seja, 
numeros-fndices. Embora, conforme ja foi mencionado, esse tipo de parametro 
seja mais utilizado na area economica — na avaliagao de pregos e renda —, 
nao podemos ignorar que, a partir do momenta em que a empresa Analisando 
Ltda. comegar a armazenar esse fndice e fizer as comparagoes dele com ele 
mesmo em perfodos distintos, ela estara se utilizando de um fndice padrao 
comparative. Essa e nao so a definigao simplificada, como tambem a aplicagao 
de um numero-fndice importantfssimo. 

Prosseguindo agora com o exemplo, passamos novamente a palavra para 
o dono da empresa, que chama mais um funcionario. O senhor Curiosinho 
e o responsavel por coletar os dados dos clientes, e o proprietario I he da a 
seguinte incumbencia: 

Preciso que voce entreviste 30 clientes e pergunte, numa escala de 5 a 10, 
o nfvel de satisfagao deles em relaqao ao produto que compraram aqui em 
nossa empresa. 

Antes de o senhor Curiosinho sequer sair para cumprir a incumbencia dada 
pelo patrao, foi alertado pelo senhor Mente Aberta de que, ao selecionar os 
clientes para a entrevista, devera faze-lo de forma aleatoria para que nao haja 
vies no processo de selegao que comprometa toda a analise. 
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Voce sabe o que e uma amostra ou variavel aleatoria? Pesquise e descubra. 


Voltando agora para o exemplo, depois de algumas horas, o senhor Curio- 
sinho trouxe os dados anotados nas fichas de entrevistas e entregou-os ao dono 
da empresa. O dono agradeceu e fez a seguinte pergunta: 

Senhor Mente Aberta, o que eu fago com esse "monte de dados"? Nao me 
dizem nada. 

Sem "pestanejar", o funcionario de primeiro escalao explicou o procedi- 
mento para que os dados ali apresentados se tornassem mais inteligfveis. 

Devemos primeiramente tabula-los, ou seja, organiza-los de tal forma que 
se tornem inteligfveis e ja nos permitam alguma analise, mesmo que superficial, 
sobre esses dados. 

E foi o que ele fez: tabulou os dados apresentando como resultado o quadro 
seguinte, respeitando a ordem na qual foi feita a entrevista como parametro 
de classificaqao. 

Parece ficar evidente que o grau de satisfaqao dos clientes e razoavelmente 
bom. Basta observar que, aparentemente, a maioria das notas esta acima de 
7,0, o que indica um bom nfvel de satisfaqao. 

A partir da tabulaqao, ja foi possfvel ter uma visao preliminar dos dados. E 
claro que isso e possfvel em dados com menos variaveis, como no exemplo, 
e tambem quando o comportamento desses dados e perceptfvel a partir da 
simples observaqao. 

Mas para se chegar a uma conclusao mais aprimorada, basta agora calcular 
algum parametro que ajude o dono da empresa a conhecer o fndice de satis- 
faqao de seus clientes. 

Para isso, o senhor Mente Aberta explica a seu patrao que e necessario algum 
criterio para a analise. Um parametro que seja utilizado para definir os fndices 
ou conceitos esperados: o que significa uma boa satisfaqao e o que significa 
um baixo nfvel de satisfaqao para a empresa. 
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Ele rapidamente sugeriu o seguinte: 

Vamos considerar que notas entre 5 e 6 equivalham a "pouco satisfeito". 
Que notas entre 6,5 e 8,5 signifiquem "satisfeito" e que notas acima de 8,5 
signifiquem "muito satisfeito". Dessa forma, podemos fazer um grafico que nos 
permita visualizar como esta o indice de satisfaqao de nossos clientes. 


Quadro 1.11 Dados tabulados da pesquisa de satisfa^ao 
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Fonte: Dos autores (2014). 
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O segundo passo, entao, foi separar as notas dos clientes segundo cada um 
desses grupos. Alem disso, resolveu-se tirar uma media das notas dentro de 
cada grupo e uma media geral para as notas da amostra. 


vV 


Questdespara reflexao 


Voce sabe o que e uma media? 


Para saber mais 

A construqao de um fndice e importante porque permite comparar valores de dois periodos 
distintos, por isso e uma ferramenta util para as empresas. Elas podem criar seus proprios nu- 
meros-fndices observando, por exemplo, a evoluqao nos preqos e nas vendas de seus produtos. 
Em seu significado generico, um numero-fndice consiste em uma media de variaqoes relativas. 
Se as variaqoes medidas sao as correspondentes aos preqos, um numero-fndice de preqos deve 
ser construfdo, o mesmo acontecendo com outras variaveis, como taxas de cambio, taxas de 
juros, salarios etc. Se as variaqoes medidas sao as correspondentes as quantidades, um numero- 
-fndice especffico deve ser construfdo: por exemplo, o correspondente ao quantum da produqao 
industrial, da agrfcola, das exportaqoes, das importaqoes etc. 





Fique ligado! ^ 

Nesta unidade, foram apresentados os conceitos basicos necessarios a 
compreensao da estatistica. Entre os topicos discutidos, estao origens, 
objeto e objetivos da estatistica, que destacam como se iniciaram as 
primeiras tentativas de compreensao dos dados a partir de ferramentas 
metodologicamente voltadas ao que hoje se denomina estatistica. Destaca 
alguns dos principals termos utilizados na area da estatistica, como os 
conceitos de populaqao, unidade, amostra e variavel. Alem de ressaltar as 
vantagens da utilizaqao das metodologias estatisticas, apresenta de forma 
contundente o papel da informatizaqao como meio para sua socializaqao. 
Ademais, fez-se uma breve exposiqao sobre estatistica descritiva, explo- 
ratoria e inferencia estatistica. 
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Para concluir o estudo da unidade 


Caro aluno, voce deve estar ciente de que a Estatfstica e um dos mais impor- 
tantes instrumentais de trabalho na gestao de negocios. E atraves dela que 
dados, informaqoes, numeros tomam formas mais definidas, tornando-se, 
entao, possfveis de serem utilizados nos processos de analise de negocios 
e tomadas de decisao. Assim, nesta primeira unidade, voce tomou contato 
com os conceitos basicos. Para aperfeiqoar seus conhecimentos, continue 
estudando as demais unidades. Voce deve, tambem, acessar nossa Biblio- 
teca Digital e verificar que la estao disponfveis outros livros com os quais 
voce podera aprofundar seus estudos. Aproveite esse processo de estudos, 
anote suas duvidas e as envie ao seu tutor eletronico e professor para que 
eles possam auxilia-lo e, nao esqueqa... continue estudando! 



1. Responda as questoes: 

a) Qual a importancia da estatfstica para as empresas e para a 
academia? 

b) Sintetize os conceitos de: populaqao, unidade, amostra e variavel, 
exemplificando cada um desses termos. 

c) Quais os beneffcios da utilizaqao da estatfstica no cotidiano de 
uma empresa? 

d) No que a informatizaqao pode contribuir para o processo de 
analise de dados? 

e) Quais sao as tres fases da analise estatfstica? 

2. Classifique, de acordo com os enunciados, os tipos de amostragem: 

a) Um candidato a vereador faz uma pesquisa de intenqao de voto 
na sua regiao de residencia. 

b) Uma empresa realiza uma pesquisa com pessoas que estao cir- 
culando em uma praqa principal de uma cidade. 

c) Um representante comercial da fabrica de pao visita varias lancho- 
netes de uma cidade, pesquisando a preferencia dos consumidores. 
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j Segao 3: Tabulagao e analise de dados em graficos 

Nesta segao, serao apresentados de forma detalhada 
os conceitos de tabulagao e analise de dados em 
forma de graficos e tabelas de acordo com as normas 
tecnicas citadas pela Associagao Brasileira de Normas 
Tecnicas (ABNT). Tambem serao dados varios exem- 
plos de elaboragao de graficos utilizando o software 
Excel® da Microsoft. 
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Introdu^ao ao estudo 

E necessario ter em mente que a estatfstica e uma ferramenta essencial para 
o gestor ou administrador para as respostas dos "porques" de seus problemas, 
que podem ser explicados por uma analise de dados. Para ela ser bem usada, e 
necessario conhecer os seus fundamentos e princfpios e, acima de tudo, que o 
gestor desenvolva um espirito crftico e jamais deixe de pensar, pois e facil mentir 
usando a estatfstica, o diffcil e falar a verdade sem usa-la. Diariamente, somos 
expostos a uma grande quantidade de informaqoes numericas, semelhantes as 
relatadas. Dependendo das situaqoes, ora somos consumidores dessas infor- 
maqoes, ora precisamos produzi-las. Assim, necessitamos de capacitaqao para 
compreendermos informaqoes numericas produzidas por outros, bem como nos 
habilitarmos a construf-las. O emprego dos pracedimentos, tecnicas e metodos 
estatfsticos e fundamental para auxiliar-nos na execuqao dessas tarefas. 

Nesta unidade, que esta dividida em tres seqoes, serao abordados conceitos 
relacionados as medidas descritivas, a analise exploratoria e descritiva e aos 
conceitos de tabulaqao e analise de dados em graficos. Na Seqao 1, aborda- 
remos os conceitos relacionados as medidas descritivas, em que serao defi- 
nidos alguns conceitos basicos da estatfstica descritiva. As medidas descritivas 
basicas mais importantes sao as de posiqao e as de variabilidade, ou tambem 
conhecidas por dispersao. Nessa seqao, serao apresentadas as medidas estatfs- 
ticas que indicam medidas de tendencia posiqao — dentre elas, os conceitos 
de media, moda e mediana. Tambem estudaremos os conceitos relacionados 
as medidas de dispersao, onde serao apresentados os conceitos de amplitude 
total, desvio medio, desvio-padrao (amostral e populacional), variancia (amos- 
tral e populacional) e coeficiente de variaqao (CV). Na Seqao 2, trabalharemos 
com os conceitos relacionados a analise exploratoria e descritiva de dados, em 
que serao estudadas as tecnicas de exploraqao de dados e abordadas de forma 
detalhada a organizaqao de dados estatfsticos e as fases do metodo estatfstico. 
Na Seqao 3, serao apresentados os conceitos de tabulaqao e analise de dados 
em forma de graficos e tabelas de acordo com as normas tecnicas citadas pela 
Associaqao Brasileira de Normas Tecnicas (ABNT). 
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Segao 1 


Medidas descritivas 


A estatfstica descritiva esta presente em praticamente todas as areas do co- 
nhecimento humano, seja ajudando nos estudos e analises de dados, na busca 
de informagoes relevantes ou como elemento de comprovagao cientffica de 
fenomenos relevantes. Conhecer e dominar alguns de seus metodos coloca 
o profissional em situagao de vantagem no que se refere a competitividade e 
empregabilidade, alem de proporcionar as organizagoes que dispoem desses 
profissionais meios de igualmente se tornarem mais competitivas. "O que e a 
estatfstica?" Vamos desvendar essa ciencia? Entao vamos la! A estatfstica des¬ 
critiva e a etapa inicial da analise utilizada para descrever e resumir os dados. 
A disponibilidade de uma grande quantidade de dados e de metodos computa- 
cionais muito eficientes faz com que essa area da estatistica se tome essencial. 
As medidas descritivas tern por objetivo descrever um conjunto de dados de 
forma organizada e compacta por meio de suas fungoes basicas — dentre elas, 
destacam-se as medidas de posigao e as de dispersao. O importante e destacar, 
neste momento, que esses calculos e conclusoes nao podem ser extrapolados 
para a populagao e restringem-se apenas para a amostra. 

A estatfstica descritiva pode ser definida como um conjunto de tecnicas 
destinadas a descrever e resumir dados a fim de que possamos tirar conclu¬ 
soes a respeito de caracterfsticas de interesse. Em geral, utilizamos a estatfstica 
descritiva na etapa inicial da analise quando tomamos contato com os dados 
pela primeira vez. Objetivando tirar conclusoes de modo informal e direto, a 
maneira mais simples seria a observagao dos valores colhidos. 

Entretanto, ao nos depararmos com uma grande massa de dados, perce- 
bemos, imediatamente, que a tarefa pode nao ser simples. Para tentar retirar 
dos dados informagoes a respeito do fenomeno sob estudo, e preciso aplicar 
algumas tecnicas que nos permitam simplificar a informagao daquele particular 
conjunto de valores. A finalidade da estatfstica descritiva e tornar as coisas mais 
faceis de entender, de relatar e discutir. 

A estatfstica descritiva implica em descrever aquilo que os dados indicam 
apos tabulados, convertidos em tabelas e graficos. Como o proprio nome sugere, 
sua fungao e descrever aquilo que estamos vendo a partir da analise daquilo 
que estamos observando (amostra). 
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Como voce pode perceber, a estatistica descritiva e a exploratoria sao 
similares, pois ambas objetivam explicitar informaqoes presentes nos dados 
analisados. Porem, diferem em termos de tecnicas e aprofundamento. 

A exploraqao pressupoe investigates profundas a serem posteriormente 
descritas da melhor forma possfvel. Dessa maneira, podemos dizer que, en- 
quanto voce esta efetuando seus calculos em busca de informaqoes escondidas 
em seus dados, voce esta "explorando" e, a partir do momento em que voce 
inicia a explicitaqao dos resultados, voce esta "descrevendo-os". 

Calcular parametros como media e as medidas de variabilidade e explicita- 
-los pode ser considerado uma exploraqao e uma descriqao dos dados coletados. 

Para melhor compreendermos os propositos da estatistica exploratoria e 
descritiva, e necessario conhecermos algumas definiqoes basicas: 

Atributos: quando os dados estatisticos apresentam um carater qualitative, 
o levantamento e os estudos necessarios ao tratamento desses dados sao de- 
signados genericamente de estatistica de atributo. 

Variavel: e uma condiqao ou caracteristica das unidades da populaqao. Por 
exemplo, a idade das pessoas residentes no Brasil, ou a classe social, sao vari¬ 
aveis. As variaveis sao classificadas em dois tipos: qualitativas e quantitativas. 

Variaveis qualitativas ou por atributos: quando os dados sao distribuidos 
em categorias mutuamente exclusivas. Seus valores sao expressos por atributos. 
Sao exemplos de variaveis qualitativas: sexo, cor da pele, cidade de nascimento, 
tipo sangufneo (O, A, B, AB) etc. Essas variaveis sao classificadas em dois tipos: 
j Nominal (exemplo: genero — masculino e feminino); 
j Ordinal (exemplo: classe social — A, B, C, D e E). 

Variaveis quantitativas ou numericas: Quando os dados sao de carater niti- 
damente quantitative e o conjunto dos resultados possui uma estrutura nume- 
rica. Sao exemplos de variaveis quantitativas: idade, estatura, taxa de colesterol 
etc. As variaveis quantitativas ou numericas sao classificadas em dois tipos: 
j Variavel discreta: a variavel discreta so pode assumir apenas valores in- 
teiros. Sao exemplos de variaveis discretas: numero de filhos (0, 1, 2, 3 
etc.), numero de estudantes em uma sala de aula etc.; 
j Variavel continua: a variavel contfnua pode assumir qualquer valor em 
um dado intervalo. Exemplo de variavel contfnua: peso de uma pessoa 
(60,50 Kg). 
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Dados: Sao os valores da variavel em estudo, obtidos por meio de uma 
amostragem. Os dados sao do mesmo tipo que as variaveis. Por exemplo, uma 
variavel discreta produz dados discretos. 

Dados brutos: e uma tabela ou relaqao de elementos que nao foram nume- 
ricamente organizados. E diffcil formarmos uma ideia exata do comportamento 
do grupo como um todo a partir de dados nao ordenados ou dados brutos. 

Exemplo: 45, 41,42, 41,42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 
58, 60, 51 

ROL: e a tabela obtida apos a ordenaqao dos dados brutos (de forma cres- 
cente ou decrescente). 

Exemplo: 41,41,41,42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 
58, 60, 60 

A Estatistica e dividida basicamente em duas areas: estatistica descritiva e in- 
ferencial. No nosso curso, serao abrangidas ambas as areas, conforme veremos. 

Estatistica descritiva: 

Os objetivos da estatistica descritiva envolvem coleta, organizaqao e descri- 
qao de um conjunto de dados quantitativos ou qualitativos. Com a construqao 
de graficos, tabelas e com o calculo de medidas com base em uma coleqao 
de dados numericos, poderemos compreender melhor o comportamento da 
variavel expressa no conjunto de dados sob analise. 

Estatistica inferencial: 

E a area da estatistica responsavel pela analise e interpretaqao dos dados, 
associada a uma margem de incerteza. Nessa fase, sao empregados metodos 
que tornam possivel a estimaqao de caracterfsticas de uma populaqao baseadas 
nos resultados amostrais. 

A conduqao de uma pesquisa eleitoral ilustra o processo da inferencia esta- 
tfstica. O pesquisador, impossibilitado de entrevistar todos os eleitores (popu- 
laqao), seleciona uma amostra de eleitores e questiona sobre suas preferences 
eleitorais. Baseado nas respostas amostrais, conclui sobre todo o conjunto dos 
eleitores. Junto com suas conclusoes, o pesquisador informa o nfvel de confianqa 
de que seus resultados amostrais reflitam corretamente o comportamento de 
todos os eleitores (populaqao). 
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1.1 Medidas de posi^ao 

Como o proprio titulo sugere, nosso objetivo aqui e a determinaqao de 
medidas que ofereqam o posicionamento da distribuiqao dos valores de uma 
variavel que desejamos analisar. 

As medidas de posiqao sao os calculos estatisticos que representam uma 
serie de dados orientando-nos quanto a posiqao da distribuiqao de dados, sendo 
as medidas de posiqao mais utilizadas a media aritmetica, a moda e a mediana. 

Media aritmetica (x) 

A medida de tendencia central mais comum para um conjunto de dados e 
a media aritmetica. A media aritmetica amostral de um conjunto de dados e o 
quociente entre a soma dos valores do conjunto e o numero total dos valores. 

_ soma dos valores de x > x 

X= - = 4^_L 

numero de observagoes n 


Onde: xi sao os valores da variavel e n o numero de valores. 

Exemplo 1 : Encontrar a media aritmetica para um conjunto de observaqoes: 
5, 1, 6, 2,4. 

Solu^ao: Temos cinco observaqoes: n=5. Entao: 


_ S + l + 6 + 2 + 4 
n 5 


= 3,6 


Calculo da media para dados agrupados em intervalos de classe 

Quando a amostra e muito grande e os dados sao discretos, podem ocorrer 
valores repetidos. Nesse caso, e razoavel organizar os dados em uma tabela de 
distribuiqao de frequencias e trabalharmos com dados agrupados. 

Quando os dados estiverem agrupados em uma distribuiqao de frequencia, 
usaremos a media aritmetica dos valores de x„ x 2/ x 3 ,....x n ponderados pelas 
respectivas frequencias absolutas: F u /> F n . Assim: 
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Exemplo 2: "neste caso, convencionamos que todos os valores inclufdos 
em um determinado intervalo de classe coincidem com o seu ponto medio e 
determinamos a media aritmetica ponderada por meio da formula anterior, onde 
X; e o ponto medio da classe" (AMAZONAS, 2013, p. 16). Dada a seguinte 
distribuiqao de frequencia na Tabela 2.1: 


Tabela 2.1 Tabela de distribui^ao de frequencia 


Intervalos das classes 

Frequencia (F;) 

X i 

Xj.Fi. 

50 |—54 

4 

52 

208 

54 |—58 

9 

56 

504 

58 |—62 

11 

60 

660 

62 |— 66 

8 

64 

512 

66 |—70 

5 

68 

340 

70 |— 74 

3 

72 

216 

Total 

40 


2440 


xp Ponto medio das classes 

Fonte: Amazonas (2013). 


Aplicando a equaqao anterior, temos que: 

_ Y x,f 2440 

x = 4 c, , ' y ' =-= 61 

I f 40 

Media Aritmetica Ponderada (x): 

A media aritmetica ponderada tambem e chamada de media ponderada. E 
empregada quando as variaveis tern diferentes importancias relativas ou, ainda, 
diferentes pesos relativos. 

No calculo da media ponderada, cada valor coletado na serie tern uma 
participaqao proporcional ao seu peso, isto e, proporcional a importancia 
relativa no conjunto. 

O calculo da media ponderada e obtido pela soma das variaveis multipli- 
cadas pelos seus pesos, dividida pela soma dos pesos de cada variavel. Assim: 
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-_ P i *x l +p 2 *x 2 +p 3 *x 3 + ....p n *x n 

P l +P 2 +P 3 + ....Pn 


^J,p, 

1=1 



Onde: 

x — media ponderada 

X| — observagoes ou numeros da variavel em estudo 
Pi — ponderagoes ou pesos da variavel 

Exemplo: Calcular a media aritmetica ponderada dos numeros 10, 14, 18 

e 30, sabendo-se que os seus pesos sao, respectivamente, 1, 2, 3 e 5. 

Resolugao: 


1*10 + 2*14 + 3*18 + 5*30 
1 + 2 + 3 + 5 



1.1.1 Mediana (Md) 

A mediana e o valor que ocupa a posigao central do conjunto de dados 
ordenados (ROL), tal que 50% dos valores sao menores que a mediana e os 
demais 50% sao maiores. 

Para a sua determinagao, utiliza-se a seguinte regra depois de ordenada a 
amostra de n elementos dispostos segundo uma ordem (crescente ou decres- 
cente): "Quando o numero de elementos (n) da serie estatfstica for fmpar, ha- 
vera coincidencia da mediana com um dos elementos da serie" (AMAZONAS, 
2013, p. 19). Nesse caso, existira um unico valor de posigao central — esse 
valor sera a mediana. 

Por exemplo, considere o conjunto de dados {2, 5, 6, 9, 10, 13, 15}. O valor 
que divide essa serie em duas partes iguais e igual a 9. Logo, a mediana e 9. 

Quando o numero de elementos da serie estatistica for par, nunca havera 
coincidencia da mediana com um dos elementos da serie de dados. A mediana 
sera sempre a media aritmetica dos 2 elementos centrais da serie de dados. Por 
exemplo, no conjunto de dados { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }, a mediana sera 
a media aritmetica do 5° e do 6° termos da serie. Portanto, a mediana sera = 
(2+3) / 2, ou seja, m = 2,50. 
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1.1.2 Calculo da mediana em dados agrupados em intervalos de 
classe (variaveis continuas) 

Para se calcular a mediana em dados agrupados, devemos seguir os seguin- 
tes passos: 

1° Passo: determinamos as frequences acumuladas (X fi = n); 

2° Passo: calculamos como a variavel e contfnua, nao se preocupe se 
n e par ou fmpar; 

3° Passo: marcamos a classe correspondente a frequencia acumulada ime- 
diatamente superior a X fi / 2. Tal classe sera a classe mediana (classe Md); 

4° Passo: Calculamos a mediana pela seguinte formula: 


Mediana — l Mi + 


A 


■FAA 


Onde: 

l Md = limite inferior da classe mediana. 
n = tamanho da amostra ou numero de elementos. 

FAA= frequencia acumulada da classe anterior a classe mediana. 
h = amplitude do intervalo da classe mediana. 

F Md = frequencia da classe mediana. 


Tabela 2.2 Exemplo — calculo da mediana para dados agrupados 


Intervalos das classes 

Frequencia (Fi) 

^acumulada 

35 |— 45 

5 

5 

45 |—55 

12 

17 

55 |—65 

18 

35 (classe Md) 

65 |—75 

14 

49 

75 |—85 

6 

55 

85 |—95 

3 

58 

Total 

58 



Fonte: Do autor (2014). 


1° Passo: Calcula-se 


— . Como n = 58, temos que — = 29°elemento. 
2 2 


5 25 


50 


75 100 

























96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:28 - June 30, 2014 - PG-65 


Indices e ana Uses estatisticas 57 


2° Passo: Identifica-se a classe mediana (Md) pela frequencia acumulada. 
Nesse caso, a classe mediana e a 3°. 

3° Passo: Aplica-se a formula: 


Mediana — l Md 



( \ 

--FAA 

*h 


l 2 J 



f 

1 Md 


Nesse caso: l Md = 55; n = 58; FAA= 1 7; h = 10, F Md = 18; Logo: 


Mediana — 55 + 



f 58 1 

*10 


-17 


2 


_ 



18 


61,67 


1.1.3 Moda (Mo) 

Dentre as principals medidas de posiqao, destaca-se a moda. E o valor da 
amostra que mais se repete, ou seja, valor que ocorre com maior frequencia. 

A moda e calculada quando os dados nao estao agrupados. Ela e facilmente 
reconhecida: basta, de acordo com a definiqao, procurar o valor que mais se 
repete (AMAZONAS, 2013, p. 17). Por exemplo, no conjunto de dados {7, 8, 
9, 10, 10, 10, 11, 12}, a moda e igual a 10. 

Ha series que nao possuem valor modal, isto e, nas quais nenhum valor 
aparece mais vezes que outros. Por exemplo, o conjunto de dados {3, 5, 8, 10, 
12} nao apresenta moda. A serie e amodal. 

Em outros casos, pode haver dois ou mais valores de concentraqao. Di- 
zemos, entao, que a serie tern dois ou mais valores modais. Por exemplo, o 
conjunto de dados {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 
7 (AMAZONAS, 2013, p. 1 7). Nesse caso, a serie e bimodal. 

Distributees simples: quando uma tabela de distribuiqao de frequencia 
apresenta grande quantidade de dados. E importante destacar a classe de maior 
frequencia, a chamada classe modal. Essa classe mostra a area em que os dados 
estao concentrados. Assim, para a distribuiqao: 
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Tabela 2.3 Exemplo — calculo da moda para dados agrupados 


xi 

243 

245 

248 

251 

307 

Fi 

7 

17 

23 

20 

8 


Fonte: Dos autores (2014). 


A moda sera 248 (maior frequencia), que sera indicada por Mo=248 (moda) 


1.1.4 Calculo da moda em valores agrupados em intervalos de 
classe: 


A classe que apresenta a maior frequencia e denominada classe modal. Pela 
definigao, podemos afirmar que a moda, nesse caso, e o valor dominante que 
esta compreendido entre os limites da classe modal. Um dos metodos para 
determinagao da moda e a aplicagao da formula de CZUBER: 

1° Passo: Identifique a classe modal (aquela que possui maior frequencia); 

2° Passo: Aplicar a formula: 


Mo = l + 


d l 


cl { +d 2 


'h 


V 1 "7 

Onde: 

I = limite inferior da classe modal 

d T = frequencia da classe modal — frequencia da classe anterior a da classe modal 
d 2 = frequencia da classe modal — frequencia da classe posterior a da 
classe modal 

h = amplitude da classe modal 


Tabela 2.4 Exemplo — Calculo da moda para dados agrupados em distribuigao de 
frequencia 


Intervalos das classes 

Frequencia (Fi) 

0 |—1 

3 

1 |—2 

10 

2 |—3 

17 

3 |— 4 

8 

4 |— 5 

5 

Total 

43 


Fonte: Dos autores (2014). 
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2 


1° Passo: Identifica-se a classe modal. Nesse caso, trata-se da 3° classe 

|-3. 


2° Passo: Sabendo que: / = 2; d 1 = 17-10=7; d 2 = 17-8=9; h = 1, aplica-se 
a formula dada acima: 


r 

Mo = 2 + 

V 


7 + 9 


* 1 = 2,44 (moda estimada) 


1.2 Separatrizes 

Alem das medidas de posiqao citadas anteriormente, ha outras que, conside- 
radas individualmente, nao sao medidas de tendencia central, mas estao ligadas 
a mediana, relacionadas a sua caracterfstica de separar a serie em duas partes 
que apresentam o mesmo numero de valores. Essas medidas sao os quartis, 
os decis e os percentis que sao, juntamente com a mediana, conhecidas pelo 
nome generico de separatrizes. 

1.2.1 Quartis — Q 

Denominamos quartis os valores de uma serie que a dividem em quatro 
partes iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a 
serie em quatro partes iguais. 

j Q,= 1° quartil, deixa 25% dos elementos. 

_i Q 2 = 2° quartil, deixa 50% dos elementos. O quartil 2 (Q2) sempre sera 
igual a mediana da serie . 
j Q 3 = 3° quartil, deixa 75% dos elementos. 

1.2.2 Quartis em dados nao agrupados 

O metodo mais pratico e utilizar o principio do calculo da mediana para os 
3 quartis. Na realidade, serao calculadas "3 medianas" em uma mesma serie. 

Exemplo 1 : Calcule os quartis da serie: { 5, 2, 6, 9, 10, 13, 15 } (n=impar) 
_i O primeiro passo a ser dado e o da ordenaqao (crescente ou decrescente) 
dos valores: { 2, 5, 6, 9, 10, 13, 1 5 }; 

_i O valor que divide a serie acima em duas partes iguais e igual a 9, logo 

a mediana = 9, que sera = Q2 = 9; 
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j Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de va- 
lores iguais proporcionados pela mediana (quartil 2). Para o calculo do 

quartil 1 e 3, basta calcular as medianas das partes iguais provenientes 
da verdadeira mediana da serie (quartil 2). 

Logo: 

Em { 2, 5, 6 }, a mediana e = 5. Ou seja, sera o quartil 1 = Q1 = 5. 

Em {10, 13, 1 5 }, a mediana e =13. Ou seja, sera o quartil 3 = Q3 = 13. 
Exemplo 2: Calcule os quartis da serie: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13} 


(n=par) 


_l A serie ja esta ordenada, entao calcularemos o quartil 2 = mediana = 

(5+6)/2 = 5,5; 

j O quartil 1 sera a mediana da serie a esquerda da mediana central: {1, 
1, 2, 3, 5, 5} Q1 = (2+3)/2 = 2,5; 

j O quartil 3 sera a mediana da serie a direita de Md: {6, 7, 9, 9, 10, 13 } 

Q3 = (9+9)/2 = 9. 

1.2.3 Quartis para dados agrupados em classes 

Usamos a mesma tecnica do calculo da mediana, bastando substituir, na 
formula da mediana, 

E fi / 2 por k . E fi / 4, sendo k o numero de ordem do quartil. 

Assim, temos: 


4 




Onde: 

I* = limite inferior da classe mediana. 

FA A = frequencia acumulada da classe anterior a classe mediana. 
f* = frequencia simples da classe mediana. 
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h* = amplitude do intervalo da classe mediana. 

Exemplo 3: Calcule os quartis da Tabela 2.5: 


Tabela 2.5 Distribui^ao de frequencia — Calculo dos Quartis 


Classes 

Frequencia (f 1 ) 

Frequencia acumulada 

50 |— 54 

4 

4 

54 |—58 

9 

13 

58 |— 62 

11 

24 

62 |— 66 

8 

32 

66 |— 70 

5 

37 

70 |— 74 

3 

40 

Total 

40 



Fonte: Dos autores (2014). 


O quartil 2 = mediana. Logo: 

S fi / 2 = 40 / 2 =20 

Logo, a classe mediana sera 58 | — 62 

I* = 58 FAA = 13 f* = 11 h* = 4 


0 2 = / + 


A 


--FAA 


/ 


Substituindo esses valores na formula, obtemos: 

Md = 58 + [(20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2 
O quartil 1: 1 *Xfi / 4 = 10 (correspondente a 2° classe) 


Qi=I* + 




FAA 


f 


Qt = 54 + [(10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1 
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O quartil 3: 3*Efi / 4 = 30 (correspondente a 4° classe) 


Q 3 = r + 


- FA A 


/ 


Q 3 = 62 + [(30 -24) x 4] / 8 = 62 + 3 = 65 = Q3 


1.2.4 Decis — D 

A definiqao dos decis obedece ao mesmo principio dos quartis, com a 
modificaqao da porcentagem de valores que ficam aquem e alem do decil que 
se pretende calcular. A formula basica sera: k*Z fi / 10, onde k e o numero 
de ordem do decil a ser calculado. Indicamos os decis: D1, D2,..., D9. Desse 
modo, precisamos de 9 decis para dividirmos uma serie em 10 partes iguais. 

De especial interesse e o quinto decil, que divide o conjunto em duas 
partes iguais. Assim sendo, o quinto decil e igual ao segundo quartil, que por 
sua vez e igual a mediana. 

Para D5, temos: 5*E fi/10 = Zfi/2 

Exemplo: Calcule o 3° decil da tabela anterior com classes. 

k = 3, onde 3.Z fi / 10 = 3 x 40 / 10 = 12. 

Esse resultado corresponde a 2 a classe. 

D3 = 54 + [(12 - 4) x4] / 9 = 54 + 3,55 = 57,55 = D3 


1.2.5 Percentil ou centil 

Denomina-se percentis ou centis os noventa e nove valores que separam 
uma serie em 100 partes iguais. Indicamos: PI, P2,..., P99. E evidente que P50 

= mediana; P25 = Q1 e P75 = Q3. 

j O calculo de um centil segue a mesma tecnica do calculo da mediana, 

porem a formula sera k = 2 fi / 100, onde keo numero de ordem do 
centil a ser calculado. 


5 25 


50 


75 100 
















96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:28 - June 30, 2014 - PG-71 


Indices e ana Uses estatisticas 63 



Considerando o que foi apresentado ate o momenta nesta unidade, 
voce consegue visual izar uma aplicaqao dessas ferramentas para me- 
didas de posiqao no cotidiano do gestor de uma organizaqao? 


1.3 Medidas de dispersao 

Devido a variabilidade das medidas de tendencia central, ainda que con- 
sideradas como numeros que tern a finalidade de representar uma serie de 
dados, elas nao podem por si mesmas destacar o grau de homogeneidade 
ou heterogeneidade que existe entre os valores que compoem o conjunto e, 
portanto, nao bastam para descrever um conjunto de dados. As medidas de 
tendencia central sao tanto mais descritivas de um conjunto de dados quanto 
menor for a variabilidade. Entao, quando apresentamos medidas de tendencia 
central para descrever um conjunto de dados, devemos indicar tambem uma 
medida de variabilidade ou dispersao. 

Medidas de dispersao absoluta — Amplitude total (A) 

E a diferenqa entre o maior e o menor valor observados no conjunto de 
dados, conforme segue: 


A = Maior Valor - Menor Valor 


Exemplo: 

Para a serie: 10,12,20,22,25,33,38, a amplitude total e dada por: 


Amplitude — 38 —10 = 28 


Variancia populacional (a 2 ) e amostral (S 2 ) 

“A variancia e uma medida que tern pouca utilidade como estatfstica de- 
scritiva, porem e extremamente importante na inferencia estatfstica e em com- 
binaqoes de amostras" (AMAZONAS, 2013, p. 24). A definiqao de variancia 
populacional (s2) e dada por: 



N 
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Onde: 

a 2 indica variancia populacional e le-se "sigma"ao quadrado. 

x = media. 

Fi = frequencia. 

N = tamanho da populaqao. 

Para o caso do calculo da variancia amostral (s 2 ), e conveniente o uso da 
seguinte formula: 

3 2_ Yi x i-x') 2 - F i 

n -1 

Onde: x = media amostral, n = tamanho da amostra. 

Desvio-padrao populacional (a) e amostral (s) 

O desvio-padrao e a "medida de dispersao mais geralmente empregada, 
pois leva em consideraqao a totalidade dos valores da variavel em estudo. E 
um indicador de variabilidade bastante estavel" (AMAZONAS, 2013, p. 22). 

Observando-se a formula original para o calculo da variancia, nota-se que 
ela e uma soma de quadrado. Dessa forma, se a unidade da variavel for, por 
exemplo, metro (m), teremos como resultado metro ao quadrado (m 2 ). Para se 
ter a unidade original, necessita-se definir outra medida de dispersao, que e a 
raiz quadrada da variancia — o desvio-padrao. Assim, temos: 

CT = y/ 2 ( desvio-padrao populacional ) 
s (desvio-padrao amostral) 

Exemplo 3: calcular a variancia amostral (s 2 ) e o desvio padrao amostral (s) 
da seguinte distribuiqao amostral 


Tabela 2.6 Exemplo 3 


Xj 

5 

7 

8 

9 

11 

Fi 

2 

3 

5 

4 

2 


Resoluqao do exemplo 3: 

Primeiramente, precisamos do valor da media, conforme vimos anterior- 
mente na web aula 3. Entao, temos que: 
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Tabela 2.7 Exemplo de calculo da media (Exemplo 3) 


Xj 

Frequencia (Fi) 

Xj.Fj 


5 

2 

10 


7 

3 

21 


8 

5 

40 


9 

4 

36 


11 

2 

22 


Total 

16 

129 


Fonte: Dos autores (2014). 



Portanto, a media e: 

129 

x = - = 8,06 

16 



2°) Calculo da variancia amostral (s 2 ) 



Para calcularmos a variancia amostral (s 2 ), 

e preciso encontrar o valor de 

Sdj 2 Fj. Para tanto, uma nova coluna devera ser 

considerada na 

tabela anterior: 

Tabela 2.8 Calculo de variancia 

amostral (Exemplo 3) 



Xj Fi 

X,.Fj 

\x t — x\ = r/,- 


5 2 

10 

5-8,06 = 3,06 

18,73 

7 3 

21 

7-8,06 = 1,06 

3,37 

8 5 

40 

8-8,06 = 0,06 

0,02 

9 4 

36 

9-8,06 = 0,94 

3,53 

11 2 

22 

11-8,06 = 2,94 

17,29 

Total 16 

129 


42,94 


Fonte: Dos autores (2014). 


= I 2 .f, = 42j4 

n- 1 16-1 
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Portanto, 

3°) Calculo desvio-padrao amostral (s) 

s = , logo: s = ^2,86 = 1,69 

Resumindo: a distribuigao possui media 8,06. Isto e, seus valores estao em 
torno de 8,06 e seu grau de dispersao e de 1,69, medido pelo desvio-padrao. 

Medida de dispersao relativa: Coeficiente de variagao (CV) 

Trata-se de uma medida relativa de dispersao util para comparagao em 
termos relativos do grau de dispersao em torno da media de series distintas. E 
dado por: 


CV = 3*100 

X 

Onde: s = desvio-padrao amostral ex- media. 

Exemplo 4: numa empresa, o salario medio dos homens e de R$ 4000,00, 
com desvio-padrao de R$ 1500,00, e o das mulheres e de R$ 3000,00, com 
desvio-padrao de R$ 1200,00. 

Resolugao do exemplo 4: 

CV homens = - = ^ 50 ° * too = 37,50% 

homens - 


CV, 


i. = i200 * 10 o = 40,00% 
x 3000 


Logo, podemos concluir que, nessa empresa, os salarios das mulheres apre- 
sentam maior dispersao relativa que o salario dos homens. 


Para saber mais 


Voce deve estudar mais sobre estatfstica descritiva lendo o seguinte livro: 
GARCIA, R. Estatistica. Sao Paulo: Pearson Education do Brasil, 2009. 
Leia as paginas 61 e 62, unidade 3. 
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1 \ 


Atividades de aprendizagem 

1. Durante sete meses consecutivos, os rendimentos de certa aplicagao 
financeira foram iguais a 1,20%, 0,90%, 1,50%, 0,70%, 2,10%, 
1,40% e 1,80%. Com base nesses dados, calcule o rendimento medio 
(retorno esperado) e o desvio-padrao amostral (risco do investimento). 

2. A tabela a seguir apresenta a distribuigao das importagoes de certa 
empresa. Com base nestes dados, calcular o valor da media das im- 
portapoes dessa empresa. 


Tabela 2.9 Distribui^ao de frequencias — Exercicio 2 


Valor importado (R$) 

Frequencias (f 1 ) 

50.000 |— 60.000 

5 

60.000 |— 70.000 

10 

70.000 |— 80.000 

20 

80.000 |— 90.000 

10 

90.000 1— 100.000 

5 

Total 

50 
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Segao 2 


Analise exploratoria e descritiva 


Nesta segao, vamos abordar alguns conceitos relevantes do estudo da analise 
exploratoria de dados conceitos da estatistica descritiva. Muitas vezes, ao ou- 
virmos essas palavras, nos lembramos de indices, taxas e numeros de um modo 
geral. Porem, a estatistica e muito mais do que isso. Na verdade, a estatistica e 
essencial para nossa vida. Fazemos uso dela todos os dias: quando pesquisamos 
o prego de uma mercadoria, inferimos de quanto sera o aumento do aluguel, 
conjecturamos o comportamento da populagao nas urnas na proxima eleigao. 
Seus conceitos ja permeiam os mais diversos campos de conhecimento e sao 
indispensaveis no campo cientffico e no mercado financeiro, por exemplo. Isso 
ocorre porque a estatistica nos permite organizar, descrever, analisar e inter¬ 
pretar dados referentes ao fenomeno que estamos estudando. Dessa forma, ela 
tern um papel importante no meio academico e profissional, pois nos auxilia na 
compreensao dos fenomenos que nos cercam. Vamos desvendar essa ciencia? 

Entende-se por analise exploratoria o processo pelo qual aplicamos me- 
todologias quantitativas, tecnicas matematicas e estatisticas com o objetivo 
de obter informagoes que possam, porventura, estar ocultas ou "mascaradas" 
quando fazemos apenas a observagao superficial dos dados. 

Dentre as tecnicas de exploragao a regressao que discutiremos neste texto 
e uma das mais interessantes e uteis. 

Quando fazemos a observagao superficial de dados, podemos tirar algumas 
conclusoes, como, por exemplo, aumentou, diminuiu, manteve-se etc.; porem, 
quando fazemos perguntas mais complexas — como "Por que isso ocorreu?", 
"Em fungao do que tal fenomeno aconteceu?", "Qual e a tendencia futura do 
comportamento de determinada variavel?" etc. —, necessitamos de tecnicas 
mais completas do que a simples observagao. 

"A analise exploratoria de dados nos fornece um extenso repertorio de meto- 
dos para um estudo detalhado dos dados antes de adapta-los. Nessa abordagem, 
a finalidade e obter dos dados a maior quantidade possfvel de informagao que 
indique modelos plausfveis a serem utilizados numa fase posterior — a analise 
confirmatory de dados, ou inferencia estatfstica" (MEDRI, 2011, p. 2). 

Nas nossas atividades cotidianas, o metodo e sempre determinante, ou seja, 
se distribufssemos tres receitas de bolo para tres confeiteiras, fornecendo-lhes 
todos os ingredientes da receita, inclusive com a mesma marca e exatamente 
o mesmo peso de cada um, certamente, pela logica, deveriam sair tres bolos 
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iguais. Entretanto, sabe-se que isso nao ocorre, e os bolos todos diferem um 
do outro — inclusive no que tange ao sabor. 

Na estatistica nao e diferente, apesar de existirem as fases do metodo que 
apresentaremos a partir de agora. Ao fazer pesquisas, um mesmo metodo pode 
diferir, dependendo do pesquisador. Contudo, e importante conhecer, pelo me- 
nos, os principais, para que tenhamos ideias de como organizar uma pesquisa. 

Portanto, o objetivo deste topico e que voce, academico/a, conheqa as 
cinco fases do metodo estatistico e aplique-o nas atividades desenvolvidas de 
agora em diante. 

2.1 Organiza^ao de dados estatisticos — fases do 
metodo estatistico 

A estatistica descritiva tern por objetivos planejar uma pesquisa, coletar da¬ 
dos, descrever e analisa-los, retirando o maior numero possfvel de informaqoes 
neles contidos, com o objetivo de utiliza-las nas tomadas de decisao. Seguindo 
esse raciocfnio, a estatistica divide o estudo e a analise dos dados em algumas 
fases, que sao descritas a seguir: 

1 a fase: defini^ao do problema. Definir objetivos: 

Saber exatamente aquilo que se pretende pesquisar e o mesmo que definir 
corretamente o problema inicial. 

2 a fase: planejamento da pesquisa: 

Como levantar informaqoes? Que dados deverao ser obtidos? Qual levanta- 
mento a ser utilizado? Cronograma de atividades? Custos envolvidos? Seguem 
abaixo algumas perguntas que precisam ser respondidas no planejamento de 
um levantamento de dados estatisticos: 

j O que? — Caracterfsticas a serem observadas: variaveis. 

_i Quem? — Os elementos a serem pesquisados: populagao/amostra. 

j Como? — O instrumento de coleta de dados: metodo de amostragem a 
ser utilizado, questionario /entrevista estruturada etc. 

3 a fase: execugao da pesquisa, coleta de dados: 

Fase operacional. E o registro sistematico de dados, focando no objetivo 
determinado inicialmente. 

_i Dados primarios (coleta direta): quando sao publicados pela propria 
pessoa ou organizaqao que os tenha coletado. Exemplos: tabelas do censo 
demografico do IBGE, uma empresa que realiza uma pesquisa para saber 
a preferencia dos consumidores pela sua marca. 
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A coleta e direta quando obtida diretamente da fonte. Ex.: empresa que re- 
aliza uma pesquisa para saber a preferencia dos consumidores pela sua marca. 

A coleta direta de dados pode ser classificada em relaqao ao fator tempo 
como: 

a) Continua (registro) — quando e feita continuamente, tal como a de nasci- 
mentos, obitos, os registros da fiscalizaqao eletronica de velocidade etc. 

b) Periodica — quando e feita em intervalos de tempo constantes, como os 
censos demograficos, matrfculas semestrais e/ou anuais dos estudantes 
etc. 

c) Ocasional — quando feita ocasionalmente a fim de atender a uma con- 
juntura ou a uma emergencia, como no caso de epidemias, pesquisas 
eleitorais, avaliaqoes etc. 

j Dados secundarios (coleta indireta): quando sao publicados por outra 
organizaqao. Exemplo: quando determinado jornal publica estatfsticas 
referentes ao censo demografico extrafdas do IBGE. 

Observagao: e mais seguro trabalhar com dados primarios. O uso de dados 
secundarios traz o grande risco de erros de transcriqao. 

4 a fase: apuragao dos dados: 

Resumo dos dados atraves de sua contagem e agrupamento. E a condensa- 
qao e tabulaqao de dados. 

5 a fase: analise e apresenta^ao dos dados: 

Ha duas formas de apresentaqao, que nao se excluem mutuamente: 

j Apresentagao de dados em tabelas — e uma apresentaqao numerica dos 
dados em linhas e colunas distribufdas de modo ordenado, construfdas 
segundo normas tecnicas citadas pela fundaqao Instituto Brasileiro de 
Geografia e Estatfstica (IBGE, 1993). 

j Apresenta^ao grafica dos dados numericos — constitui uma apresentaqao 
grafica, permitindo uma visao rapida e clara da variavel estudada. 

6 a fase: lnterpreta?ao dos dados e conclusoes obtidas a partir dos dados 
(estatfstica inferencial): 

A ultima fase do trabalho estatfstico e a mais importante e delicada. Esta 
ligada essencialmente ao calculo de medidas e coeficientes, cuja finalidade 
principal e descrever a variavel estudada (estatfstica descritiva). Na estatfstica 
indutiva, ou inferencial, a interpretaqao dos dados se fundamenta na teoria da 
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probabilidade, que tern por base a induqao, ou inferencia, e abstrai, desses 
resultados, conclusoes e previsoes. 

2.1.1 Metodo 

E o conjunto de meios dispostos convenientemente para chegar a um fim 
desejado. Dos metodos cientfficos, vamos destacar o metodo experimental e 
o estatistico. 

2.1.2 Metodo experimental 

Conforme o proprio termo sugere, esse metodo consiste em, atraves da 
experimentaqao, manter constantes todas as causas (fatores) menos uma, 
variando-a de modo que se possa descobrir seus efeitos, caso existam. Esse 
metodo e amplamente usado nos diversos campos da atividade humana, bem 
como nas disciplinas de Ffsica, Qufmica, Biologia etc. 

Se voce for gerente de uma empresa e permutar um funcionario do setor 
A com um do setor B e fizer um acompanhamento do resultado, voce estara 
fazendo um metodo experimental. 

2.1.3 Metodo estatistico 

Na impossibilidade de se fazer uso do metodo experimental, visto que nem 
sempre temos controle dos fatores envolvidos para fixar seus valores, usamos o 
metodo estatistico. O metodo estatistico considera todas as causas envolvidas no 
processo como variavel e procura determinar, no resultado final, que influences 
cabem a cada uma delas. Como exemplo, pode-se citar a viabilidade, ou nao, do 
lanqamento de determinado produto a partir de uma pesquisa de mercado. Pelo 
processo do metodo experimental, nesse caso, poderia ser dispendioso e ina- 
dequado (basta imaginar a quantidade de fatores envolvidos nessa pesquisa — 
nao temos como fixar todos eles). 

2.1.4 Critica dos dados 

Obtidos os dados, eles devem ser cuidadosamente criticados a fim de 
procurar-se possfveis falhas e imperfeiqoes, de modo que nao se incorra em 
erros grosseiros que possam influir sensivelmente nos resultados. A crftica dos 
dados pode ser de origem externa ou interna. 
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j Critica externa: quando visa atribuir as causas dos erros ao informante, 
por distraqao ou ma interpretaqao das perguntas que I he foram feitas. 
j Critica interna: quando visa observar os elementos originais dos dados 
da coleta. 

Questdespara reflexao 

Ao fazer sua pesquisa, pense num tema que voce ache interessante, 
pois e preciso que voce se sinta estimulado para que seus objetivos 
sejam alcanqados. Voce ja pensou em fazer uma pesquisa? Que tema 
acha interessante na area de gestao empresarial? 




Para saber mais 


Voce deve estudar mais sobre estatfstica descritiva lendo o seguinte iivro: 

DE SOUZA, A. M. S.; GESSER, K.; DALPIAZ, M. V. A. D. Caderno de Estudos — Estatistica. 
Editora Uniasselvi, INDAIAL-SC, 2011. 

Leia o topico 2 — paginas 11 a 16. 



Atividades de aprendizagem 


1. Cite as fases do metodo estatfstico. 

2. Para voce, o que e coletar dados? 

3. Como podem ser apresentados, ou expostos, os dados? 
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Tabula^ao e analise de dados em 



Um dos elementos importantes na estatistica e o uso de graficos e tabelas 
para apresentar os dados estatfsticos e seus calculos. Voce pode usar grafi¬ 
cos e tabelas para organizar seus dados e dar mais visibilidade e clareza as 
informagoes. 

Assim como existem algumas regras e normas que devem ser observadas 
quando vamos elaborar um texto cientffico ou academico, para organizar os 
dados em series estatisticas, ou em distribuigao de frequences, existem algu¬ 
mas normas nacionais definidas pela Associagao Brasileira de Normas Tecnicas 
(ABNT) que devem ser respeitadas. Na sua opiniao, o uso de graficos e tabelas 
para representar os dados estatfsticos e importante? Com certeza sim, pois as 
ferramentas que serao apresentadas nessa segao sao essenciais para que voces 
organizem de forma correta os dados estatfsticos que foram obtidos. Sendo as¬ 
sim, convido todos voces a explorar mais esta area da estatfstica tao importante 
para o futuro gestor. Vamos la? 


3.1 Tabelas 


As tabelas podem ser consideradas quadros em que resumimos um conjunto 
de dados organizados e dispostos sistematicamente em linhas e colunas. 

Temos que ter em mente que a tabela devera ser uma forma objetiva de 
se demonstrar o comportamento de variaveis; o que se deve buscar sao repre- 
sentagoes simples que possibilitem ao leitor a compreensao do fenomeno sem 
muito esforgo. 

Dessa forma, toda tabela estatistica deve conter elementos essenciais e 
elementos complementares, quando necessario. Uma tabela deve apresentar 
a seguinte estrutura: 

3.1.1 Elementos essenciais 

_! Titulo — no tftulo, devemos indicar a natureza do fato estudado, ou seja, 
o que foi estudado; tambem deve conter as variaveis escolhidas na analise 
do fato, o local e a epoca em que os dados foram obtidos. 

j Corpo — e formado pelo conjunto de linhas e colunas em que podemos 
observar as series horizontais e verticals de informagoes. 
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j Cabegalho — no inicio de cada coluna, devemos designar a natureza do 
conteudo de que a coluna trata. 

_i Coluna indicadora — nessa coluna, devemos evidenciar a natureza do 
conteudo de cada linha. 

3.1.2 Elementos complementares 

j Fonte — na fonte, devemos indicar a entidade responsavel pela sua organi- 
zagao ou que forneceu os dados primarios. Deve ficar no rodape da tabela. 

j Notas — quando e necessario algum outro esclarecimento alem dos essen- 
ciais, eles devem ser colocados em forma de notas no rodape da tabela. 

j Chamadas — sao colocadas tambem no rodape da tabela e sao necessarias 
para esclarecer pormenores ou detalhes em relagao as caselas, colunas 
ou linhas. 

j Atengao: nenhuma casela deve ficar em branco; elas devem sempre 
apresentar um numero ou sinal. O lado direito e esquerdo das tabelas 
devem sempre ser abertos. 

A Tabela 2.10 apresenta um exemplo de tabela que obedece as normas 
tecnicas. 

Tabela 2.10 Popula^ao residente no Brasil segundo o sexo, de acordo com o censo demografico 
de 2000 


Sexo 

Populagao residente 

Masculino 

83.576.015 

Feminino 

86.223.155 

Total 

169.799.170 

Fonte: IBGE (2003). 


Conforme criterio de agrupamento, as tabelas podem representar diversas 
series estatfsticas, que sao descritas a seguir. 

a) Serie cronologica 

E a serie estatfstica em que todos os dados sao observados segundo a 
epoca de ocorrencia. Nessa serie, a variavel e o tempo, sendo o fato e o local 
fixos. A Tabela 2.11 apresenta um exemplo de tabela que descreve uma serie 
cronologica. 
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Tabela 2.11 Vendas da Companhia Alfa — 2010a2014. 


Ano 

Vendas (em R$ 1.000,00) 

2010 

5642 

2011 

7550 

2012 

10009 

2013 

11728 

2014 

18873 

Fonte: Departamento de marketing da Companhia 

Alfa (dados fictfcios). 

b) Serie geografica ou de localiza^ao 

E a serie estatistica em que os dados sao observados segundo a localidade 

de ocorrencia. Nesse tipo de serie, a 

variavel e o local e sao fixos o fato e a 

epoca. Exemplo—Tabela 2.12. 


Tabela 2.12 Vendas de computadores por empresa — 2013 

Empresa controlada 

Numero de computadores vendidos 

A 

279 

B 

321 

C 

194 

D 

112 

E 

228 

Total 

1134 

Fonte: Dados fictfcios. 


c) Serie especifica 


E a serie estatistica em que os dados sao agrupados segundo a modalidade 

de ocorrencia, ou seja, varia o fato e 

permanece constante a epoca e o local. 

Exemplo —Tabela 2.13. 


Tabela 2.13 Regime de trabalho dos colaboradores da empresa Alfa 

Regime de trabalho 

Porcentagem 

Horista 

29% 

Tempo integral 

35% 

Tempo parcial 

36% 


Fonte: Dados fictfcios. 
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d) Series conjugadas 

Tambem sao conhecidas como tabelas de dupla entrada. Essas tabelas sao 
adequadas quando queremos apresentar duas ou mais series ao mesmo tempo, 
de forma que tenhamos duas ordens de classificagao: uma horizontal e outra 
vertical. O exemplo a seguir e de uma serie geografica-temporal. 

Tabela 2.14 Vendas relativas ao 1° trimestre de 2013 das filiais da "Roda de Ouro Vei'culos" 


Filiais 

Janeiro/2013 

Fevereiro/2013 

Margo/2013 

Parana 

8260 

5900 

7450 

Santa Catarina 

6450 

6050 

5800 

Rio Grande do Sul 

7300 

5600 

7200 

Total 

22000 

17550 

20450 


Fonte: Dados fictfcios. 


3.2 Apresenta^ao de dados qualitativos 

Quando observamos dados qualitativos, classificamos cada unidade da 
amostra em uma dada categoria. A ideia e resumir as informagoes na forma de 
uma tabela que mostre as contagens (frequencias) em cada categoria, obtendo, 
entao, uma tabela de distribuigao de frequencia. 

a) Distribuigao de frequencias 

A distribuigao de frequencias e uma serie estatfstica em que os dados sao 
agrupados com as suas respectivas frequencias absolutas. 

Nas tabelas de distribuigao de frequencias, e usual fornecer a proporgao 
(frequencia relativa) de unidades que caem em cada categoria. A frequencia 
relativa e dada por: 

_ „ . „ , ■ . Frequencia 

r requencia Relativa (Jr) — - 

Tamanho da Amostra 

Nas tabelas de distribuigao de frequencias, e usual fornecer a proporgao 
(frequencia relativa) de unidades que pertencem a cada categoria. 

ATabela 2.15 apresenta um exemplo de distribuigao de frequencia de dados 
qualitativos. 
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Tabela 2.15 Opiniao dos consumidores sobre determinado produto 


Respostas 

Frequencia 

Frequencia relativa (fr) 

Percentual (%) 

Bom 

1300 

1300 =0,52 

2500 

52% 

Regular 

450 

450 =0,18 

2500 

18% 

Ruim 

125 

125 =0,05 

2500 

5% 

Nao respondeu 

625 

625 =0,25 

2500 

25% 

Total 

2500 

1,00 

100% 


Fonte: Dados fictfcios. 


3.3 Apresenta^ao de dados quantitativos ou numericos 

Os dados numericos sao apresentados na ordem em que sao coletados. 
Tambem podem ser apresentados em tabelas de distribuiqao de frequences 
(com ou sem intervalos de classe), conforme veremos a seguir. 

Distribuiqao de frequencia sem intervalos de classe: e a simples conden- 
saqao dos dados conforme as repetiqoes de seus valores. Para uma amostra 
de tamanho razoavel. Essa distribuiqao de frequencia e inconveniente, ja que 
exige muito espaqo. 

A Tabela 2.16 apresenta um exemplo de distribuiqao de frequencia de dados 
quantitativos sem intervalo de classes. 

Tabela 2.16 Distribuigao do numero de faltas de 30 empregados de uma determinada empresa 
no semestre 


Numero de faltas 

Frequencia 

Percentual (%) 

0 

9 

30,00 % 

1 

10 

33,30 % 

2 

5 

16,70 % 

3 

3 

10,00 % 

4 

2 

6,70 % 

5 

0 

0,00 % 

6 

1 

3,30 % 

Total 

30 

100,00 % 


Fonte: Dados fictfcios. 
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Para uma amostra de tamanho razoavel, essa distribuigao de frequencia e 
inconveniente, ja que exige muito espago. Tabelas com grande numero de da¬ 
dos nao oferecem ao leitor visao rapida e global do fenomeno. Por essa razao, 
tanto dados discretos quanto contfnuos, desde que em grande numero, devem 
ser apresentados em tabelas de distribuigao de frequencia com intervalos de 
classes, conforme veremos a seguir. 

Distribuigao de frequencia com intervalos de classe : quando o tamanho 
da amostra e elevado, e mais indicado efetuar o agrupamento dos valores em 
varios intervalos de classe. Para construir uma tabela de distribuigao de frequencia 
com intervalos de classe, siga os procedimentos a seguir: 

1° Passo: organize os dados brutos em um ROL; 

2° Passo: encontre o valor maximo e minimo do conjunto de dados e calcule 
a Amplitude total (A), que e a diferenga entre os valores maximo e minimo. 
Portanto: 


A = Maior Valor — Menor Valor 

3° Passo: Calcule o numero de classes (K): o numero de classes de uma 
representagao sera um numero inteiro proximo de K, que pode ser obtido por 
varios metodos, sendo os mais usuais: 

Regra de Sturges: 

K = l + 3,3*log 10 « 

Onde: K e o numero de classes e n e o numero de dados (tamanho da 
amostra). 

O indicado e sempre o arredondamento do valor de K obtido para um valor 
mais alto. 

Observagao: o calculo de K por meio de formulas pode servir como refe¬ 
renda, mas nao deve ser entendido como obrigatorio. 

4° Passo: decidido o numeros de classes, calcule, entao, o tamanho do 
intervalo de classe (h), que e definido por: 



K 


Assim como no caso do numero de classes (K), o tamanho do intervalo de 
classe (h) deve ser aproximado para o maior valor inteiro. Por exemplo, se K = 
6,61, usa-se K = 7; e se h = 1,7, usa-se h = 2. 


5 25 


50 


75 100 












96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:29 - June 30, 2014 - PG-87 


Indices e analises estatisticas 79 

5° Passo: organize as classes de maneira que a primeira contenha o menor 
valor observado. O primeiro elemento das classes seguintes sempre sera for- 
mado pelo ultimo elemento da classe anterior. 

Exemplo: vamos construir uma tabela de distribuiqao de frequences das 
idades dos funcionarios de uma amostra de 50 elementos selecionados de uma 
empresa. 

Dados brutos: 


62 

56 

20 

48 

22 

54 

25 

65 

37 

27 

37 

29 

30 

30 

45 

31 

54 

44 

34 

35 

44 

36 

37 

26 

37 

29 

38 

38 

38 

40 

41 

43 

33 

36 

45 

32 

31 

46 

51 

21 

58 

50 

47 

53 

24 

45 

20 

49 

18 

25 







1° Passo: a partir dos dados brutos, construir o ROL (ordenaqao dos dados 
em ordem crescente): 


18 

20 

20 

21 

22 

24 

25 

25 

26 

27 

29 

29 

30 

30 

31 

31 

32 

33 

34 

35 

36 

36 

37 

37 

37 

37 

38 

38 

38 

40 

41 

43 

44 

44 

45 

45 

45 

46 

47 

48 

49 

50 

51 

53 

54 

54 

56 

58 

62 

65 







2° Passo: determinar a Amplitude total (A): 

A = Maior Valor - Menor Valor 
A = 65-18 = 47 

3° Passo: Como os dados serao agrupados em classes, e preciso escolher o 
numero de classes (K): 

Pela Regra de Sturges, temos que: K - l + 3,3*log 10 n , sendo que n=50. 
Portanto: 


K - 1 + 3,3*log 10 (50) = 1 + 3,3* (1,7) = 6,61 = 7 
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4° Passo: Calculo do tamanho do intervalo de classe (h): 



47 

T 


= 6,71 s 7 


Quanto aos limites das classes, utilizaremos o seguinte criterio a | — b (in- 
cluiremos nessa classe todos os elementos maiores ou iguais a a e menores do 
que b ). A Tabela 2.17 mostra um exemplo de uma tabela de distribuiqao de 
frequencia para variavel contfnua. 


Tabela 2.17 Distribui^ao de frequences que representa a idade dos funcionarios de certa 
empresa (n=50) 


Classes 

Intervalos das 
classes 

Frequencia (Fi) 

Frequencia 
relativa (fi) 

% 

1 

18 |— 

25 

6 

6/50= 0,12 

12 

2 

25 |— 

32 

10 

10/50 = 0,20 

20 

3 

32 |— 

39 

13 

13/50 = 0,26 

26 

4 

39 |— 

46 

8 

8/50 = 0,16 

16 

5 

46 |— 

53 

6 

6/50 = 0,12 

12 

6 

53 |— 

60 

5 

5/50 = 0,10 

10 

7 

60 |— 

67 

2 

2/50 = 0,04 

4 

Soma 



50 

1 

100 


Fonte: Dados fictfcios. 


3.3.1 Apresentafao de dados em graficos 

Quando queremos representar visualmente os dados estatfsticos, podemos 
fazer isso utilizando as representaqoes graficas. Mas, atenqao: as representaqoes 
graficas devem sempre corresponder a uma tabela, sem, contudo, substituf- 
-la. Os graficos devem ter as seguintes caracteristicas: devem obedecer a uma 
escala, usar o sistema de coordenadas, ter simplicidade, ser claro e, principal- 
mente, deve corresponder a veracidade dos dados. 

Graficos de informa^ao: esses graficos sao usados geralmente quando que¬ 
remos proporcionar ao publico em geral uma visualizaqao rapida e clara. Como 
sao graficos caracteristicamente expositivos, podemos dispensar comentarios 
adicionais. Tambem podemos omitir as legendas, desde que as informaqoes 
relevantes estejam presentes no grafico. 
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Graficos de analise: esses graficos sao mais adequados ao trabalho com a 
estatistica, pois fornecem elementos uteis para a analise dos dados, alem de 
ser tambem informativo. Normalmente, os graficos de analise sao acompa- 
nhados de sua respectiva tabela estatistica. Tambem podemos incluir um texto 
explicativo, que tern como objetivo esclarecer o leitor dos pontos principais 
divulgados no grafico. 

O uso de graficos e muito apreciado em nossa sociedade pelo fato de per- 
mitir uma visualizagao rapida e eficiente. Mas devemos ficar atentos, uma vez 
que um grafico mal construfdo pode transmitir uma informagao deturpada em 
relagao a informagao verdadeira. Normalmente, isso ocorre por problemas de 
escala, em que as proporgoes entre os dados nao sao respeitadas. 

Diagramas: os diagramas sao graficos geometricos que apresentam duas 
dimensoes. Sao os mais utilizados para representar series estatisticas. 

Vamos ver agora algumas classificagoes de graficos: 

Todo grafico deve apresentar titulo e escala. O titulo deve ser colocado 
abaixo do grafico. As escalas devem ser crescentes da esquerda para a direita 
e de baixo para cima. 

3.3.2 Graficos de colunas e barras 

Quando as legendas necessarias para a compreensao dos dados nao sao 
breves, usamos preferencialmente os graficos em barras horizontais. Nesse tipo 
de grafico, os retangulos tern a mesma base, e as alturas sao proporcionais ao 
valor quantitative dos dados. A ordem a ser respeitada e a ordem cronologica, 
no caso de series temporais, e a decrescente, se a serie for geografica ou cate- 
gorica. Vamos ver alguns exemplos: 

No grafico de colunas, as barras sao apresentadas na posigao vertical. 
Para ilustrar o grafico de colunas, serao utilizados os dados apresentados na 
Tabela 2.17, originando, assim, a Figura 2.1 (grafico de colunas com linhas 
auxiliares — grades e rotulos). 
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Figura 2.1 Opiniao dos consumidores sobre determinado produto (grafico de colunas) 



Resposta 


Fonte: Dos autores (2014). 


No grafico de barras, as barras sao apresentadas na posigao horizontal, 
como apresentado na Figura 2.2. 


Figura 2.2 Opiniao dos consumidores sobre determinado produto (grafico de barras) 



0 200 400 600 800 1000 1200 1400 


Frequencia 


Fonte: Dos autores (2014). 
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3.3.3 Graficos de linhas e lispersao 

Os graficos de linhas e dispersao exibem uma serie como um conjunto 
de pontos conectados por uma unica linha. As linhas dos graficos sao usadas 
para representar grandes quantidades de dados que ocorrem em um perfodo 
de tempo contfnuo (series cronologicas). E o grafico que melhor representa 
a evoluqao conjunta de duas variaveis quantitativas, sendo X considerada a 
variavel independente e Y a variavel dependente. 

A Figura 2.3 ilustra um grafico de linhas que contem tres series. 


Figura 2.3 Exemplo do grafico de linhas 



3.3.4 Graficos de setores ou pizza 

E a representaqao grafica de uma serie estatfstica em um cfrculo, por meio 
de setores. E utilizado quando se pretende comparar cada valor da serie com 
o total. 

A partir dos dados apresentados naTabela 2.9, foi obtido o grafico de setores 
apresentado na Figura 2.4. 
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Figura 2.4 Vendas da Companhia Alfa — 2004-2008 (graficos e setores) 

Vendas 



Fonte: Dos autores (2014). 


3.3.5 Histograma 

E o grafico que melhor apresenta as frequences de uma variavel quantitativa 
continua agrupada em classes. Quando os dados sao continuos e a amostra e 
grande, e mais conveniente condensar os dados, isto e, organizar uma tabela 
de distribuiqao de frequences, agrupar os dados em classes e, a partir disso, 
desenhar um histograma. 

O histograma e a representaqao grafica de uma distribuiqao de frequencia, 
formado por um conjunto de retangulos justapostos cujas bases se localizam 
sobre o eixo horizontal, de tal modo que seus pontos medios coincidam com 
os pontos medios dos intervalos de classe. 

Para ilustrar o histograma, serao utilizados os dados apresentados naTabela 
2.15, obtendo-se, assim, a Figura 2.5. 

Figura 2.5 Histograma para idade de 50 funcionarios de certa empresa 



Fonte: Dos autores (2014). 
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O histograma dispoe de informagoes de modo que seja possfvel a visuali- 
zagao da forma de distribuigao do conjunto de dados, alem da percepgao do 
valor central e da dispersao dos dados em torno desse valor central. Pelos dados 
da Figura 2.5, fica facil perceber que a maior quantidade de funcionarios tem 
idade entre 32 e 38 anos. 

O histograma contem as mesmas informagoes da tabela de distribuigao 
de frequences. Sao representagoes que buscam a organizagao de grupos de 
dados quantitativos. 

3.3.6 Pictogramas 

Sao os graficos construidos a partir de figuras que representam a intensidade 
do fenomeno. Como sua forma e atraente, ele e muito utilizado para chamar 
a atengao do publico em geral, podendo ser muito utilizado em Marketing. 
Segundo Bruni (2008), alguns aspectos relacionados aos pictogramas devem 
ser sempre observados: 

a) Os sfmbolos devem ser autoexplicativos; 

b) As diferentes quantidades devem expressar-se mediante maior ou menor 
numero de sfmbolos, e nao mediante um aumento ou diminuigao do 
sfmbolo basico; 

c) Os graficos devem proporcionar uma visao geral do fenomeno, e nao 
detalhes minuciosos; 

d) Os pictogramas estabelecem comparagoes gerais, devendo ser evitados 
para interpretar afirmagoes ou dados isolados. 


Tabela 2.18 Venda de lanches por regiao (em 1000 unidades) 


Regiao 

Vendas 

Norte 

4 

Sul 

5 

Leste 

6 

Oeste 

3 


Fonte: Bruni (2008). 


Para ilustrar o pictograma, serao utilizados os dados apresentados naTabela 
2.18, obtendo-se assim a Figura 2.6. 
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Figura 2.6 Exemplo de pictograma 


iit 11 cni p-j-'I'im 1 Mr 



i-1 i-1-r- 

f i a 4 t * 

Fonte: Adaptada de Bruni (2008). 


1. Na planilha, organize os dados que voce deseja plotar em um grafico. 

Os dados podem ser organizados em linhas ou colunas — o Excel 
determina automaticamente a melhor maneira de plota-los no grafico. 
Alguns tipos de grafico (como graficos de pizza e de bolhas) exigem 
uma organizaqao especffica dos dados. 

2. Selecione as celulas que contem os dados que voce deseja usar no 
grafico. 

Dica: se voce selecionar apenas uma celu la, o Excel plotara automatica¬ 
mente todas as celulas que contem dados adjacentes a essa celula em um 
grafico. Se as celulas que voce deseja plotar em um grafico nao estiverem 
em intervalo contfnuo, sera possfvel selecionar celulas nao adjacentes 
ou intervalos, ate que a seleqao forme um retangulo. Voce tambem pode 
ocultar as linhas ou as colunas que nao deseja plotar no grafico. 

3. Na guia Inserir, no grupo Graficos, siga um destes procedimentos: 

j Clique no tipo de grafico e, em seguida, clique no subtipo de grafico que 
deseja usar. 

j Para ver todos os tipos de grafico disponfveis, clique em Q para iniciar 
a caixa de dialogo Inserir Grafico (Figura 2.7). Em seguida, clique nas 
setas para rolar entre os tipos de grafico. 
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Figura 2.7 Inserir graficos — Software Excel—> 


ai j»c • 4* o 

Colunas Llnhas Pizza Barras Area Dispersao Outros 

» Graficos» 

Graficos fi 


Exemplos: 

Na elaboragao dos graficos a seguir, utilizando o software Excel, utilizaremos 
os dados contidos na Tabela 2.12 dessa unidade. 

a) Exemplo 1 — Grafico de linhas 

Inserir os dados na planilha do Excel conforme exposto na Figura 2.8: 


Figura 2.8 Dados da Tabela 2.14 — Planilha do Excel 


K J < - 
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n: 
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y - t TT il 
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U ■ ib Mi| %BH “V 

n iTiir ir»T vi?-' 


Fonte: Dos autores (2014). 


Com o mouse, selecionar todos os dados a serem plotados no grafico, con- 
forme indicado na Figura 2.9. 
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Figura 2.9 Planilha do Excel — sele<:ao dos dados 
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Fonte: Dos autores (2014). 


Na guia Inserir —» Graficos, selecionar a opgao linhas (Figura 2.10), obtendo- 
-se, assim, o grafico de linhas apresentado na Figura 2.11. 


Figura 2.10 Planilha do Excel — grafico de linhas 
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Fonte: Dos autores (2014). 
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Figura 2.11 Grafico de linhas elaborado no Excel® 



Fonte: Dos autores (2014). 


b) Exemplo 2 — grafico de colunas 

A insergao dos dados na plan i I ha do Excel segue o mesmo padrao ja utili- 
zado no exemplo a. 

Na guia Inserir -> Graficos, selecionar a opgao colunas (Figura 2.12), 
obtendo-se, assim, o grafico de linhas apresentado na Figura 2.13. 


Figura 2.12 Planilha do Excel — grafico de colunas 
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Fonte: Dos autores (2014). 
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Figura 2.13 Grafico de colunas elaborado no Excel® 



Fonte: Dos autores (2014). 


c) Exemplo 3 — grafico de barras 

A insergao dos dados na plan i I ha do Excel segue o mesmo padrao ja utili- 
zado no exemplo a. 

Na guia Inserir —» Graficos, selecionar a opgao barras (Figura 2.14), ob- 
tendo-se, assim, o grafico de linhas apresentado na Figura 2.15. 


Figura 2.14 Planilha do Excel — grafico de barras 
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Fonte: Dos autores (2014). 
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Figura 2.15 Grafico de barras elaborado no Excel® 



Fonte: Dos autores (2014). 

3.3.7 Diagrama ou grafico boxplot 

Segundo Bruni (2008), o boxplot , ou caixa de dados, e um dos mais usuais 
graficos da estatfstica. Representa a dispersao dos dados, revelando a mediana 
e os quartis — medidas de posiqao que foram apresentadas na seqao 1 desta 
unidade. 

O boxplot e um grafico utilizado para avaliar a distribuiqao empfrica dos 
dados. Ele e formado pelo primeiro e terceiro quartil e pela mediana. As hastes 
inferiores e superiores se estendem, respectivamente, do quartil inferior ate o 
menor valor nao inferior ao limite inferior, e do quartil superior ate o maior 
valor nao superior ao limite superior. Os limites sao calculados da forma abaixo: 

Limite inferior: Q, - 1,5(Q 3 - Q,) 

Limite superior: Q 3 - 1,5Q 3 - Q,) 

A Ligura 2.16 apresenta um esquema generico de um boxplot. 
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Figura 2.16 Exemplo de boxplot , separado por grupos 



Fonte: Cuia... (2012). 


Atraves de uma representagao simples, e possfvel verificar a posigao central 
do conjunto ordenado dos dados, denominado mediana, e as subdivisoes das 
metades das series ordenadas, denominadas quartis (BRUNI, 2008). 

A base do retangulo central e representada pelo primeiro quartil. Abaixo 
desse ponto, estao situadas 25% das observagoes na serie ordenada. A caixa 
costuma ser dividida por um segmento de reta, que representa exatamente a 
mediana — separatriz ou mediana de ordenamento, que deixa 50% das obser¬ 
vagoes da serie ordenada abaixo e 50% acima. O topo da caixa correspondente 
ao terceiro quartil — abaixo deste situam-se 75% das observagoes e, acima, 
25%. Os seguimentos de reta horizontais representam os valores maximos e 
mfnimos da serie ordenada (BRUNI, 2008). 

A Figura 2.17 ilustra um grafico de boxplot dos pontos obtidos por uma 
amostra. 
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Figura2.17 Exemplo de Boxplot 
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Fonte: Guia... (2012). 


O boxplot pode, ainda, ser utilizado para uma comparagao visual entre dois 
ou mais grupos. Por exemplo, duas ou mais caixas sao colocadas lado a lado 
e se compara a variabilidade entre elas, a mediana e assim por diante. Outro 
ponto importante e a diferenga entre os quartis (Q 3 - Q,), que e uma medida 
da variabilidade dos dados. 


3.3.8 Como criar um grafico de boxplot utilizando o software Excel® 

1. Para criar o grafico de boxplot , crie uma tabela conforme o modelo 
abaixo e siga o roteiro. 



1 

2 

3 

4 

5 

6 

maximo 

82.269 

82.275 

80.110 

86.423 

85.654 

84.300 

Q3 

57.840 

63.619 

63.849 

70.048 

71.021 

72.200 

media 

37.597 

52.645 

52.798 

58.059 

58.800 

58.456 

mediana 

39.873 

51.755 

51.897 

55.717 

56.748 

53.992 

Q1 

10.968 

24.103 

35.792 

41.168 

45.467 

46.346 

Minimo 

7.653 

9.044 

15.721 

17.137 

21.789 

28.956 


Fonte: Guia... (2012). 


2. Crie um grafico de linhas no Excel, sendo uma linha para cada informagao. 

3. Na aba Padroes, selecione Linha Nenhuma e, para Marcador, escolha 
o trago (— ). 
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4. Na aba Opgoes, selecione Linhas de Maximo/Mmimo e Barras 
superiores/inferiores. 

5. Perceba que tern uma ordem nas entradas Q1, Maximo, Media, Mfnimo e 
Q3. Portanto, utilize as setinhas nesta tela do Excel para ajustar a ordem. 



6. Na Figura 2.18, a explicaqao do resultado do grafico Excel criado a 
partir do exemplo: 


Figura 2.18 Exemplo boxplot (utilizando o software Excel) 



fci:L~iilLLMiii:ii..a.a.i riajirct rial an j . iul I -mu i ■ 
i■ ii -ai'hi rj nhijwsJK. 
a.v.t 7 r-rbr-n: I*. - -. . r\ ■■■m 11 m 

i i jf i a-zhPi _ . i>LJ' ilih .:: mbic■. h mjt■ rii'■ -■ :■ 
la anq= lar± ip-:-: iiiii[ In ’ii:::: :mn:a biiib i 
'.Br-r ■ inniBfT'jTi 


Fonte: Cuia... (2012). 
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Questdespara reflexao 

Quando fazemos um grafico, precisamos nos atentar para que ele 
apresente uma visualizaqao rapida do fenomeno, que tenha formato 
adequado a sua publicaqao em trabalhos tecnico-cientificos — seja em 
revistas, periodicos etc. — para que ele realmente forneqa as informa- 
qoes apresentadas. Quais graficos voce considerou mais adequados e 
claros para a apresentaqao de dados estatisticos? Em revistas e jornais 
da sua area de atuaqao, que tipos sao mais comuns? 


Vara saber mais 


Voce deve estudar mais sobre estatfstica descritiva lendo o seguinte livro: 

BRUNI, A. L. Estatistica aplicada a gestao empresarial. 2. ed. Sao Paulo: Atlas, 2008. 
Leia a unidade 2 (paginas 23 a 31). 



Atividades de aprendizagem 


1. A empresa Preqo Bom Ltda. registrou o seguinte numero de faltas de 
funcionarios em determinado perfodo. A partir destes dados, construa 
o histograma. 


Numero de Faltas 

F; 

3 

2 

4 

6 

5 

8 

6 

5 

7 

2 

Soma 

23 
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2. A industria Qualidade Ltda. verificou que uma amostra formada por 
360 funcionarios apresentava a seguinte distribuiqao de escolaridade. 
Com base nestes dados, construa um diagrama de colunas. 


Escolaridade 

b 

Superior 

34 

Medio 

56 

Fundamental 

112 

Tecnico 

158 

Soma 

360 


Fique ligado! 

Nesta unidade, voce viu que: 

_l A estatistica descritiva pode ser definida como um conjunto de tec- 
nicas destinadas a descrever e resumir dados a fim de que possamos 
tirar conclusoes a respeito de caracterfsticas de interesse. 
j O metodo estatfstico e composto por cinco fases: a coleta, a critica, 
a apuraqao, a apresentaqao e a analise dos dados, 
j A coleta pode ser direta ou indireta. 

j A analise e a interpretaqao dos dados estatfsticos tornam possivel o 
diagnostico de uma empresa, o conhecimento de seus problemas 
(condiqoes de funcionamento, produtividade), a formulaqao de 
soluqoes apropriadas e um planejamento objetivo de aqao. 
j Os graficos devem obedecer a uma escala, ter simplicidade, ser claro 
e, principalmente, devem corresponder a veracidade dos dados, 
j Uma distribuiqao de frequencia pode ser feita com ou sem intervalos 
de classes. 

j O grafico indicado para apresentar dados de uma distribuiqao de 
frequencia com intervalos de classe e o histograma. 
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Para concluir o estudo da unidade 


Caros alunos (as), agora que finalizamos esta unidade, indico que sejam 
feitos os exercfcios de aprendizagem indicados a seguir e tambem que 
voces utilizem os temas abordados nesta unidade em suas atividades dia¬ 
rias, avaliando a sua aplicabilidade nas funqoes do gestor ou administrador 
como forma de aprofundar os estudos sobre esses temas. 


Atividades de aprendizagem da unidade 


1. Dada a tabela de distribuiqao de frequencia a seguir, calcule o valor 
da mediana. 


Intervalos das classes 

Frequencia (Fi) 

10 |— 14 

12 

14 |— 1 8 

25 

1 8 |— 22 

36 

22 |— 26 

35 

26 |—30 

22 

30 |—34 

18 

34 |—38 

8 

38 |—42 

4 

Total 

160 


2. Considere a tabela de frequences abaixo, que apresenta a distribui- 
qao dos salarios dos funcionarios de certa empresa. Com base nestes 
dados, calcule o valor da media deste conjunto de dados. 


Salarios (R$) 

Frequences (f s ) 

1000 1—2000 

25 

2000 |— 3000 

20 

3000 |— 4000 

15 

4000 |— 5000 

13 

5000 |— 6000 

7 

Total 

80 
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3. A distribuiqao abaixo representa o consumo (em Kg) de um determi- 
nado produto colocado em oferta em um hipermercado, que limitou 
o consumo maximo por cliente em 5 kg. Com base nestes dados, 
calcule a moda (metodo de Czuber). 


Classe 

Consumo (em Kg) 

N° de clientes 

1 

0 |—1 

12 

2 

1 |—2 

15 

3 

2 |— 3 

21 

4 

3 |—4 

32 

5 

4 |— 5 

54 


4. Considerando o seguinte conjunto de dados {5, 4, 8, 10, 12}, calcule 
o desvio-padrao amostral. 

5. Um aluno do curso de Administraqao esta estudando em seu TCC 
o perfil dos participantes nos eventos da sua area, sendo que uma 
das variaveis pesquisadas foi a idade das pessoas que participavam 
dos eventos. No total, foram entrevistadas 45 pessoas, sendo que a 
idade variou de 18 a 54 anos. Os resultados obtidos foram tabulados 
em classes de frequences, construfdas conforme os procedimentos 
formais da estatfstica. Para construqao da tabela de distribuiqao de 
frequences, a amplitude do intervalo de classes (h) devera ser: 

Obs. Calcular o numero de classes (K) pela Regra de Sturges (log 10 
45=1,65). Os valores de h e de K deverao ser arredondados para o 
maior valor inteiro. 
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Introdu^ao ao estudo 

Nesta unidade, voce conhecera o espaqo amostral e o evento — conceitos 
fundamentals da probabilidade — que darao suporte para voce fazer calculos 
probabilfsticos. Esses calculos sao relativamente simples, pois dependem muito 
da sua interpretaqao, uma vez que, matematicamente falando, sao a razao entre 
esses dois conceitos (espaqo amostral e evento). 

A partir deles, voce estudara a probabilidade da uniao de eventos, a proba¬ 
bilidade condicionada e o teorema da multiplicaqao. Todos esses conceitos es- 
tarao sempre permeados por exemplos e resoluqoes detalhadas, fique tranquilo! 

Sabendo que probabilidade esta presente em diversas situaqoes, tambem 
podemos concluir, desde ja, que ha varias maneiras de calcular e, consequente- 
mente, prever como os eventos ocorrerao. E neste ponto que voce vai conhecer 
Thamas Bayes e o seu famoso teorema! 

O que Bayes fez foi lanqar uma certa subjetividade ao prever a ocorrencia de 
um evento. Basta pensar que as informaqoes que voce tern sobre as condiqoes 
de ocorrer o evento vao acabar influenciando a previsao. Por exemplo, grosso 
modo, voce sabe que, em um determinado sorteio, "nunca" saem numeros 
entre 25 e 30. Voce sabe disso com base em sorteios anteriores e, assim, sabe 
que as chances desses numeros safrem em um proximo sorteio serao menores 
do que as chances dos demais numeros. 

Outro exemplo comum do que propos Bayes e o possfvel resultado de um 
jogo de futebol. Se voce quer prever a chance de um time A veneer um time B, 
deve levar em conta as informaqoes que se tern sobre os resultados das partidas 
anteriores, como, por exemplo, quantas vezes A venceu B e vice-versa, alem 
de levar em consideraqao as opinioes de especialistas sobre o jogo, os times, 
o campeonato e os jogadores. 

Com essas informaqoes iniciais, esperamos que voce goste do conteudo que 
estudara a seguir e que ele Ihe sirva para refletir sobre situaqoes, analisar e pro- 
por possfveis melhorias em condiqoes cotidianas e profissionais. Bons estudos! 
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Conceitos fundamentals da 
probabilidade 


E comum fazermos previsoes sobre determinados acontecimentos, sobre- 
tudo quando ja sabemos algo anterior a tal acontecimento. Um jogo de futebol 
disputado entre os times A e B e um exemplo. Voce pode se basear no numero 
de vitorias de A e prever que, por ter ganhado mais vezes e ter obtido melhores 
resultados do que B, A sera vencedor. 

Porem, existem fenomenos cujo resultado voce nao podera prever mesmo 
que eles se repitam inumeras vezes e nas mesmas condiqoes. Um bom exemplo 
e o lanqamento de um dado. Se voce jogar um dado honesto (nao viciado), 
jamais podera saber qual sera o proximo resultado antes de lanqa-lo. 

Sao resultados como esse, imprevisfveis, que sao chamados de aleatorios. 
Para Fonseca e Martins (1996), os fenomenos aleatorios levam a diferentes 
resultados. Mesmo que se faqa o experimento em condiqoes normais e iguais, 
nao ha como prever o resultado. 

Nao ha como prever, mas ha como palpitar! E justamente para que esse 
palpite possa ser levado em consideraqao e seja coerente, os matematicos 
criaram aTeoria das Probabilidades. 

A probabilidade quantifica a chance de alguma resposta para determinado 
fenomeno. Essa quantificaqao sera dada em forma de um numero entre 0 e 1, 
em que o 0 representa a resposta impossfvel no fenomeno realizado, e o 1, a 
certeza absoluta de que saira a resposta na proxima jogada. 

Um simples exemplo se da no lanqamento de uma moeda. A probabili¬ 
dade de sair cara e de 0,5, pois metade das opgoes da moeda (cara ou coroa) 
representa a resposta esperada, e nenhum lado tern vantagem sobre o outro. 

Ao estudar a probabilidade, ha dois conceitos importantes a serem enten- 
didos, o espaqo amostral e o evento, pois subsidiarao os calculos iniciais. De 
certa maneira, a probabilidade e baseada no calculo da razao entre esses dois 
conceitos. 

1.1 Espa 90 amostral 

O espaqo amostral nada mais e do que o conjunto de todas as soluqoes 
possfveis dentro de um experimento qualquer, chamado S. O numero de solu- 
qoes possfveis dentro do espaqo amostral e chamado n(S). Compreenda essa 
definiqao a partir de alguns exemplos: 
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Exemplo 1 : 

Ao langar um dado de seis faces, as solugoes possiveis sao 1,2, 3, 4, 5 e 6; 
sendo assim, determine S e n(S). 

S = {1,2,3,4,5,61, todas as faces possiveis de um dado. 

n(S) = 6, pois S possui 6 elementos. 

Exemplo 2 : 

Levando em consideragao as vogais do alfabeto, determine S e n(S). 

S = {a,e,i,o,u}, ou seja, um conjunto com todas as vogais. 

n(S) = 5 porque S possui 5 elementos. 

Exemplo 3 : 

Considerando os naipes de um baralho, determine S e n(S). 

S = {espadas, copas, ouros, paus}. 

n(S) = 4. 

Exemplo 4 : 

Se voce langar um dado de seis faces duas vezes, qual sera o S e o n(S)? 

Lembre-se do Princfpio Fundamental da Contagem, pois voce tern duas 
etapas com seis maneiras cada uma. 

Assim, para cada numero que sair no primeiro langamento, ha seis opgoes 
de numeros para o segundo langamento! 

S = {(1,1), (1,2),...,(2,3),...,(3,4),...,(4,5),...(5,6).(6,6)} 

n(S) = 36. 

Exemplo 5 : 

E se voce quiser saber o S e o n(S) que resultam do jogo de seis dezenas 
feito na mega-sena? 

Lembre-se de que voce quer saber quantas combinagoes simples de 6 ele¬ 
mentos pode formar com os 60 numeros. Sendo assim, para determinar o n(S) 
basta aplicar a formula da Combinagao: 

6n' 

C 60 6 = -~ ^ =50036860, ou seja, o n(S) e 50.063.860. 

O S seria o conjunto com todas as 50.063.860 possibilidades de jogos! 
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Para saber mais 

Nos exemplos apresentados ate aqui, fica facil determinar o espaco amostral. Porem, ha casos 
em que o espaqo amostral tern uma quantidade de elementos muito grande. Em casos como 
esses, sera necessario que voce utilize as tecnicas de contagem estudadas anteriormente, afinal, 
para o calculo de probabilidade, o que interessa e a quantidade de elementos! 

Para os calculos de probabilidades, o n(S) e utilizado; portanto, nao se preocupe com o tamanho 
do espaqo amostral, pois em casos como os do Exemplo 5, voce nao precisaria listar as 
50.063.860 combinaqoes par a determinar o Si 



1.2 Evento 

O evento e um subconjunto do espago amostral, ou seja, uma parte de S. 
O evento pode ser considerado, tambem, o conjunto das respostas esperadas, 
podendo ser representado por uma letra maiuscula (A, B,..., Z). 

Nesse caso, o n(A, B,..., Z) identifica o numero de respostas esperadas. 
Compreenda essa definigao tambem com base em alguns exemplos: 

Exemplo 1 : 

Suponha que voce langou um dado e quer saber a probabilidade de sair 
um numero menor ou igual a tres. 

As solugoes sao sair o 1, o 2 ou o 3 no langamento do dado. 

Entao, o evento pode ser chamado de A = {1,2,3}. 

Assim, n(A) = 3, pois ha 3 elementos no conjunto A. 

Exemplo 2 : 

E, se voce sortear, ao acaso, dentre as 21 consoantes do alfabeto, alguma 
que esta na palavra PROBABILIDADE. 

Veja que na palavra PROBABILIDADE existem as consoantes p, r, b, I e d. 
Entao, o evento B sera sortear, dentre as consoantes existentes, as consoantes 
(p, r, b, I, d). Logo, B = { p, r, b, I, d } e n(B) = 5. 

Exemplo 3 : 

Voce deve obter um numero fmpar, dentre os numeros de 2 dfgitos distintos, 
que se possa formar com os dez algarismos de 0 a 9. 

Para um numero ser fmpar, o dfgito da unidade deve terminar em 1, 3, 5, 
7 ou 9. 


5 25 


50 


75 100 



















96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:30 - June 30, 2014 - PG-114 


106 METODOS QUANTITATIVOS 


Para calcular, pode-se primeiro escolher o dfgito da unidade (5 modos) e 
depois escolher o dfgito da dezena (5 modos). 

Assim, se o evento fosse identificado como D, n(D) seria 5 . 5 = 25, ou seja, 
os numeros fmpares formados. Da mesma forma, D seria o conjunto dos 25 
numeros fmpares formados. 


1.3 Probabilidade geral 

A probabilidade e uma funqao que associa um numero real, entre 0 e 1, a 
chance de ocorrencia de um evento qualquer A, dentro de um espaqo amostral S. 
A probabilidade de ocorrer o evento A e identificada como P(A) e calculada por 


P(A)= 


n(A) 

n(S) 


Onde: 

A = conjunto evento. 

S = conjunto espaqo amostral. 

n(A) = numero de elementos do conjunto A. 

n(S) = numero de elementos do conjunto S. 

P(A) = probabilidade de ocorrer A. 

Existem algumas propriedades relacionadas a probabilidade de A listadas 
a seguir: 

I. 0 < P(A) < 1 

Se A e subconjunto de S, pode-se afirmar que n(A) < n(S), o que implica que 
P(A) e um numero entre 0 e 1. 

II. P(S) = 1 

Se P(S)—, entao P(S) = 1. 
n(S) 

III Se A = 0, entao P(A) = 0. 

.. n(A) 0 

Se A = 0, tem-se n(A) = 0. Com isso, P(A)=—-— -- 0. 

n(S) n(S) 

IV. P(A)+ P(A) = 1, onde A e o conjunto "nao A", chamado de comple- 
mentar de A. 

Veja que, seSeo universo, entao os subconjuntos Aobedecerao a proprie- 
dade: n(A)+n(A)=n(S) • 
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Entao: P(A)+P(A)=^'+ 

n(S) 


n(A) 

n(S) 


n(A)+n( A)n(S) 
n(S) " n(S) 


Compreenda detalhadamente por meio dos exemplos a seguir: 

Exemplo 1 : 

Determine a probabilidade de sortear, ao acaso, uma carta de copas de um 
baralho comum. 

Soluqao: 

A = sair carta de copas. 

A = {copas}. 

S = todos os possiveis naipes de um baralho. 

S= {copas, espadas, ouros, paus}. 
n(A) = 1. 
n(S) = 4. 


P( A) = 


"(A) 

n(S) 


- = 0,25. 
4 



Para saber mais 


Um baralho comum tern 52 cartas, divididas em 4 naipes (espadas, copas, ouros e paus), e cada 
naipe possui 13 cartas (2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, A). 

Para conhecer mais, acesse: <http://www.brasilescola.com/curiosidades/baralho.htm>. 


Exemplo 2 : 

No lanqamento de um dado de seis faces, qual a probabilidade de a face 
que cair voltada para cima ser um numero menor ou igual a tres? 

Soluqao: 

B = sair, no dado, as faces 1, 2 ou 3= {1,2,3}. 

S = as faces de um dado = {1,2,3,4,5,6}. 
n(B) = 3. 
n(S) = 6. 


P(B) = 


»(B) 

«( 5 ) 


3 

6 
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Exemplo 3 : 

Qual e a probabilidade de que, ao sortear uma letra do alfabeto, esta seja 
uma vogal "a" ou "i"? 

Soluqao: 

C = sortearmos uma vogal = {a, i }. 

S = o alfabeto completo = {a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,w,x,y,z}. 
n(C) = 2. 
n(S) = 26. 


P(C) = 


ri(C) 

n (S) 


— = — = 0,0769 • 
26 13 


1.3.1 Probabilidade da uniao de eventos 

A uniao de eventos pode ser caracterizada de duas maneiras, pois existem 
eventos mutuamente exclusivos e eventos nao mutuamente exclusivos. Observe 
o esquema a seguir que representa essa diferenqa: 


Figura 3.1 Esquema de eventos exclusivos e nao mutuamente exclusivos 



Fonte: Da autora (2014). 

Para identificar se o evento e mutuamente exclusivo ou nao mutuamente 
exclusivo, basta identificar a intersecqao entre os eventos. A diferenqa e que a 
intersecqao pode existir ou nao. 

Resumindo, eventos mutuamente exclusivos tern intersecqao existente; ja 
os nao mutuamente exclusivos nao tern intersecqao existente; nesse caso, ela 
e representada pelo conjunto vazio. 

Segundo Machado (1986), quando A e B sao eventos mutuamente exclu¬ 
sivos, AnB = conjunto vazio — a ocorrencia de um deles nao implica a nao 
ocorrencia do outro. 
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Exemplo 1 : Evento mutuamente exclusivo. 

Considerando um baralho completo (52 cartas), qual e a probabilidade de 
sair uma dama ou um rei? 

Eventos: 

A = sair dama. 

n(A) = 4. 

B = sair rei. 

n(B) = 4. 

AnB = conjunto vazio, pois nao ha carta que seja, ao mesmo tempo, dama 
e rei. 

Exemplo 2 : Evento nao mutuamente exclusivo. 

Considerando um baralho completo (52 cartas), qual e a probabilidade de 
sair uma carta de paus ou um dama? 

Eventos: 

A = sair qualquer carta de paus. 

n(A) = 13. 

B = sair qualquer dama. 

n(B) = 4. 

AnB = damas de paus. 

n(AnB) = 1, pois existe uma dama de paus no baralho comum. 

Agora, pense no que acontece na uniao entre os eventos A e B nos dois 
exemplos anteriores. Primeiramente, analisaremos o caso do exemplo 1, no 
qual a intersecqao entre A e B e vazia. 

Unindo os eventos A e B (damas ou reis), qual o total de cartas diferentes? 
A resposta e 8 cartas, 4 damas e 4 reis. 

Entao, voce pode pensar que o numero de elementos da uniao desses dois 
conjuntos e a soma do numero de elementos de cada conjunto: n (A U B) = n 
(A) + n (B). 

Assim, pela demonstraqao, a probabilidade de sair uma dama ou um rei, 
ao retirar-se uma carta de um baralho normal, sera: 


P(AuB) = 


ft(AuB) ft (A) ft(B) 
n(S ) ~~ ~^S) ~r^S) 


P(A) + P(B) 


Ou seja, P(A U B) = P(A) + P(B). 
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Analisando o exemplo 2, perceba que o conceito acima tern que ser ajustado 
porque, unindo os eventos A e B (paus e dama), tem-se um total de 1 6 cartas, 
mas, se for calculado n(A) + n(B), o resultado sera 1 7. 

Parece que esta errado? Mas nao esta! Esta correto! 

Veja bem, como a intersecgao no caso acima e vazia, omitiu-se sua interfe¬ 
rence no calculo. Porem, no exemplo 2, como a intersecgao existe, ela acaba 
interferindo. 

Em relagao aos conjuntos nao mutuamente exclusivos, temos: 

n (A U B) = n (A) + n (B) — n (A U B). 

Pela demonstragao a seguir, a probabilidade entre conjuntos nao mutua¬ 
mente exclusivos e: 

_ n(AuB) _ 77(A) + 77(B) - n(AnB) _ n( A) 77(B) n(AnB) _ 

U ~ n(S) ~~ n(S) ~ n(S ) + n(S ) 77(A) 

P(AuB) = P( A) + P( B) - P(AnB) 

Resumindo, a probabilidade da uniao entre dois eventos A e B sera: 

P(A U B) = P(A) + P(B) quando A e B sao mutuamente exclusivos. 

P(A U B) = P(A) + P(B) — P(A n B) quando A e B sao nao mutuamente 
exclusivos. 

Exemplo 3 : 

Numa urna, ha 10 bolas verdes, 8 azuis e 4 brancas. Qual e a probabilidade 
de uma bola azul ou branca ser retirada ao acaso? 

Solugao: 

A = sair bola azul. 

n(A) = 10, pois ha 10 bolas dessa cor na urna. 

B = sair bola branca. 

n(B) = 4, pois ha 4 bolas dessa cor na urna. 

S = todas as bolas da urna. 

n(S) = 22, pois ha 10 verdes, 8 azuis e 4 brancas. 

AnB = bola branca e azul ao mesmo tempo. 

n(AnB) = 0, pois nao ha bola assim na urna. 

Como a intersecgao e vazia, os eventos sao mutuamente exclusivos. Entao, a 
probabilidade de sair bola azul ou branca e dada pela uniao dos eventos A e B. 
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10 4 14 

P(AuB) = P( A) + P(B) = — + — = — 

22 22 22 


— = 0,6364 

11 


Exemplo 4 : 

Numa empresa, ha 150 funcionarios. Foram ofertadas possibilidades de es- 
portes para que eles praticassem uma vez por semana nas quadras da empresa. 

Dentre as varias opgoes de esportes que cada funcionario pode escolher 
para praticar, 80 escolheram futebol e 25 escolheram basquete. Sabe-se que 
10 desses funcionarios praticam os dois esportes. 

Qual e a probabilidade de sortear, ao acaso, um funcionario dessa empresa 
que pratica basquete ou futebol? 

Soluqao: 

A = pratica futebol. n(A) = 80. 

B = pratica basquete. n(B) = 25. 

A n B = pratica basquete e futebol. n(A n B) = 10. 

S = todos os funcionarios da empresa. 

n(S) = 150. 

Como a intersecqao nao e vazia, temos um caso de eventos nao mutuamente 
exclusivos. Com isso, a probabilidade da uniao dos eventos A com B sera: 


P( A) + P(B) - P(AnB) = —+ —-— = — = 0,6334 

150 150 150 150 



Para saber mais 


Se na pergunta do exercicio de probabilidade aparecer a conjungao OU entre os eventos, como 
nos exemplos anteriores, voce devera calcular a uniao entre os eventos envolvidos. 


1.3.2 Probabilidade condicionada 

Mas, e se voce quiser calcular a probabilidade de ocorrerem eventos se- 
guidos? Por exemplo, e se voce jogar mais de uma vez um dado? Como vai 
calcular a probabilidade? 

Nesses tipos de problemas, em que os eventos sao repetidos algumas vezes, 
podem existir casos com reposiqao ou casos sem reposiqao. Acompanhe essa 
diferenqa e o calculo para esses casos nos exemplos a seguir. 


5 25 


50 


75 100 

























96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:30 - June 30, 2014 - PG-120 


112 METODOS QUANTITATIVOS 

Exemplo 1 : 

Considere um lote de 200 peqas, no qual 190 sao perfeitas e 10 tern de- 
feitos. Qual e a probabilidade de retirar-se, ao acaso, duas peqas com defeito 
desse lote? 

A = retirar a primeira peqa com defeito. 

B = retirar a segunda peqa com defeito. 

Com reposigao: 

Voce tira a primeira peqa e devolve-a ao lote novamente antes de tirar a 

n(A) 10 

segunda peca. Observe que P( A) = — —- =-= 0,05 e, como a peca tirada 

n(S) 200 

e reposta no lote, P( B) = = J^L - o,05 . 

n(S) 200 

Sem reposigao: 

A primeira peqa retirada do lote nao participa do sorteio para a retirada da 
segunda peqa. Sendo assim, P(A) nao muda, ou seja, P(A) = 0,05. Mas, como 
a peqa retirada nao e reposta, restam 9 peqas defeituosas de um total de 199 

n(B) 9 

peqas, entao: f(B) =-=-= 0,045 

n(S) 199 

Exemplo 2 : 

De um baralho de 52 cartas, foram retiradas, aleatoriamente e sem reposi- 
qao, duas cartas. Sabendo-se que a primeira carta retirada e de espadas, qual 
e a probabilidade de a segunda carta ser uma dama vermelha? 

Nesse caso, a segunda probabilidade (B) e influenciada pela ocorrencia 
da primeira (A), o que caracteriza uma probabilidade condicionada, chamada 
P(B/A) (le-se: probabilidade de B se ocorreu o evento A). 

Para calcular P(B/A), basta saber que voce esta calculando P(B) em relaqao 
ao espaqo amostral A, e nao ao espaqo amostral S. 

Suponha que ocorreu o evento A, ou seja, ja foi feita a primeira etapa do 
processo (foi retirada uma carta de espadas). Como voce vai calcular a proba¬ 
bilidade de ocorrer B, sendo que ja ocorreu A, ou seja, P(B/A)? 

Basta imaginar que o espaqo amostral e o conjunto A e que a unica maneira 
de ocorrer elementos de B no conjunto Aena intersecqao dos dois. Entao: 
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P(B/A)= " (AnB) 
n( A) 


n(AnB) 
n(S) 
n( A) 
n(S) 


n(AnB) 
n( A) 


Ou seja: P(B/ A) = /? ( AnB ) 

«(A) 

Analisando a situaqao do exemplo, tem-se que P(B/ A) = — • 

Para chegar ao resultado usando a formula P(B/A) = r tem-se: 

n{ A) 

B: sair dama vermelha (na segunda retirada). 

A: sair carta de espadas (na primeira carta). 
n(S) = 52. 
n(A) = 13. 

P(A) = 13/52. 
n(AnB) = 1. 

P(AnB) = 1/52. 

1 

P(B/A) =f=n' 

52 

Exemplo 3 : 

Em um grupo de 40 estudantes do Ensino Medio, tem-se as seguintes 
caracterfsticas: 


Quadro 3.1 Idades e genero dos estudantes 


Idade 

Sexo 

Total 

M 

F 

Menos de 15 anos 

15 

12 

27 

Mais de 15 anos 

5 

8 

13 

TOTAL 

20 

20 

40 


Fonte: Da autora (2014). 
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Qual e a probabilidade de se sortear, ao acaso, dentre os estudantes, um 
menino, sabendo que ele tern mais de 15 anos? 

Solugao: 

Olhando a tabela, sabemos que a probabilidade e P( B) = , onde Beo 

evento de ser menino e, nesse caso, o espago amostral desconsidera as meninas, 
pois afirma-se que o sorteado e menino! 

Tambem deve ser feito o calculo de P(B/A), onde A e o evento de ser menino 
e B e o evento de ter mais de 15 anos: 


P(AnB) _ 40 _ 5 
P( A) _ 20 _ 20 
40 


P(B/ A) = 


Veja que, das duas maneiras, o resultado e o mesmo. 

1.3.3 Teorema da multiplica 9 ao 

OTeorema da Multiplicagao permite calcular a probabilidade de ocorrencia 
simultanea de dois eventos a partir das probabilidades condicionais. 

A partir da formula P(B/A) do calculo da probabilidade condicionada, 
tem-se: 


P(A n B) = P(A).P(B/A) ou P(A n B) = P(B).P(A/B) 


Levando em consideragao o exemplo 1 (das pegas) do item anterior, consi- 
dere um lote de 200 pegas no qual 190 sao perfeitas e 10 tern defeitos. 

Qual e a probabilidade de serem retiradas, ao acaso, duas peqas com de- 
feito desse lote? 

A probabilidade de retirada, sem reposiqao, de duas peqas com defeito e 
dada por: 

A = retirar a primeira peqa com defeito. 

B = retirar a segunda peqa com defeito. 


P(A) = 


10 1 


e P( B/ A) = — 


P(AnB) = P( A)P(B/ A) = — 


200 20 


199 

1 9 9 


= 0,0023 


20'199 3980 
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Calcular P(B/A) = e facil, pois como a primeira pega retirada tinha 

defeito, ficaram ainda 9 pegas com defeito e 190 pegas perfeitas. 

No caso especifico em que os eventos sao independentes (com reposigao), 
no qual o evento anterior nao afeta a probabilidade do evento posterior (caso 
"a" do item 5), temos que P(B/A) = P(B); entao, P(A n B) = P(A).P(B). 

Para Lipschutz (1993), um evento B e dito independente de um evento A se 
a probabilidade de B ocorrer nao e influenciada pelo fato de A ter ocorrido ou 
nao. Assim, a probabilidade de retirar, com reposigao, duas pegas com defeito e: 


P( A) = 


10 

200 


= — e P( B/ A) = P( B) = — 
20 200 


1 

20 


Assim, P(AnB) = P(A) J°(B) = —.— = 0,0025 

20 20 

Nos exemplos a seguir, voce podera identificar outros casos com e sem 
reposigao. 



Exemplo 1 : 

Qual a probabilidade de, em duas retiradas com reposigao, safrem duas 
cartas de copas de um baralho normal? 

Solugao: 

Calcule a probabilidade de sair copas na primeira carta e copas na segunda 
carta. Lembre-se de que o e representa um caso de intersecgao! 

A = sair a primeira carta de copas. 

n(A) = 13, pois ha 13 cartas desse naipe no baralho. 

B = sair a segunda carta de copas. 

n(B) = 13, pois ha 13 cartas desse naipe no baralho. 

Como o problema e com reposigao, o primeiro evento A nao influencia o 
evento secundario B, ou seja, eles sao independentes. Veja: 


P(AnB) = P(A).P(B) = = = 0,0625 

52 52 16 
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Exemplo 2 : 

Qual e a probabilidade de, em duas retiradas sem reposiqao, sairem duas 
cartas de copas de um baralho normal? 

Soluqao: 

Mesmo que agora o segundo evento B seja influenciado pelo primeiro evento 
A, pois nao ha a reposiqao da primeira carta de copas, o objetivo e calcular a 
probabilidade de sair copas na primeira carta e sair copas na segunda carta. 

Veja que, novamente, tem-se um caso de intersecgao de eventos! 

A = sair a primeira carta de copas. 

n(A) = 13, pois ha 13 cartas desse naipe no baralho. 

B = sair a segunda carta de copas. 

n(B) = 12 e 

n(S) = 51, pois o evento e sem reposiqao, e o evento A influencia no evento 
B e no espaqo amostral S. 

iq in i 

P( AnB) = P(A).P(B) = —=-= 0,0588 

52 51 2652 

Exemplo 3 : 

Uma urna contem 2 bolas pretas e 3 bolas brancas. Qual e a probabilidade 
de retirar-se duas bolas, ao acaso e sem reposiqao, e sair uma bola branca e 
uma preta? 

Soluqao: 

Nesse caso, fique atento a ordem em que as bolas estao saindo, pois pode- 
-se obter a bola branca na primeira retirada e a bola preta na segunda retirada 
ou ao contrario. Sao dois casos. Veja: 

1° caso: 

A = sair bola branca na primeira retirada. 

B = sair bola preta na segunda retirada. 

Q sj r 

P{ AnB) = P(A)P(BI A) = — = 0,3 

5 4 20 

2° caso: 

B = sair bola preta na primeira retirada. 

A = sair bola branca na segunda retirada. 

r\ Q r 

P{ BnA) = P(B)P(A/ B) = = 0,3 

4 5 20 
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Juntando os dois casos, devido a conjungao alternativa ou, temos: 

P[(A n B) U (B n A)] = 0,3 + 0,3 = 0,6 


Para saber mais 

E possivel chegar a resposta 0,6 multiplicando-se o primeiro caso por 2. Esse numero representa 
a quantidade de combinaqoes possiveis de A e B. 



Questdespara reflexao 

Em algumas areas em que for atuar como administrador, voce, por 
vezes, devera ter conhecimento de processos de produqao. Para isso, 
e relevante o conhecimento em probabilidade, uma vez que, para 
tomar decisoes acerca da troca de uma maquina que tern produzido 
peqas defeituosas, por exemplo, voce tera de calcular essas chances 
reais de ela realmente produzir peqas com defeito. 


Se tiver interesse, acesse o link: <http://www.portal-gestao.com/gestao/ 
item/2555-t%C3%A9cnicas-de-tomada-de-decis%C3%A3o-para-um-ambiente-de- 
-incerteza.html> e veja a relaqao entre as tomadas de decisao e as incertezas dentro 
das empresas, e como essa relaqao pode ter um pouco de probabilidade implfcita. 

Nesse caso, na sua opiniao, ter esse conhecimento probabilfstico auxilia nas 
tomadas de decisao dentro de uma organizaqao? Reflita sobre isso pensando 
em casos em que os calculos poderiam ser empregados. 


Atividades de aprendizagem 


1. Se voce tiver em maos um baralho comum de 52 cartas, determine 
a probabilidade de, ao retirar aleatoriamente uma carta do baralho, 
voce pegar: 

a) Uma carta vermelha. d) Um 10 vermelho ou um 4 preto. 

b) Um rei. e) Uma figura (J, Q ou K). 

c) Um 6 de espadas. 
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2 . Suponha que voce lanqou um dado equilibrado apenas uma vez. 
Determine, entao, a probabilidade de a face de cima conter: 

a) Um3. 

b) Um numero par. 

c) Um numero fmpar. 

d) Um numero menor que 6. 

3. Agora, suponha que voce tenha lanqado um dado equilibrado duas ve- 
zes e tenha observado a face que caiu voltada para cima. Determine: 

a) Os elementos do espaqo amostral. 

b) Os elementos do evento B: sair soma 7 em suas faces. 

c) Os elementos do evento C: sair o mesmo numero em ambas as 
faces. 

d) Os elementos do evento D: sair soma menor que 10 em suas faces. 

e) Os elementos do evento E: sair soma maior que 12 em suas faces. 
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Segao 2 


Teorema de Bayes 


Como voce estudou na segao anterior, a probabilidade esta presente em 
diversas situagoes do seu cotidiano, e ha diferenciadas maneiras de calcular e 
prever como os eventos ocorrerao. 

Uma das opgoes de calculo mais usadas pelos estatisticos nas previsoes, 
porem, e a quefoi desenvolvida no seculo XVIII porThomas Bayes (1702-1761). 
A ideia de Thomas Bayes para o calculo de probabilidades ficou conhecida 
como Teorema de Bayes. 

Com esse teorema, Bayes inseriu uma certa subjetividade na previsao de 
um evento, ou seja, para ele, a opiniao de quern manuseia os numeros esta 
presente de modo significativo nos calculos. Essa opiniao e baseada nas infor- 
magoes que voce tern sobre as condigoes de ocorrer o evento e, para Bayes, 
elas certamente vao influenciar na previsao. 

Por exemplo, em uma disputa de cara ou coroa, voce certamente concorda 
que a chance de ganhar e de 50%. Mas, se a moeda for jogada tres vezes, se- 
gundo Bayes, a previsao deve ser ajustada a cada jogada. Imagine que nas duas 
primeiras jogadas tenha dado "cara"; entao, a chance para a terceira jogada 
nao sera mais de 50%. 

Usar o calculo da probabilidade e justamente fazer palpites sobre determi- 
nados eventos, se vao ocorrer ou nao. Apesar de estar baseado rigidamente na 
logica e na razao, o Teorema de Bayes passou por varias controversias a medida 
que os estudos sobre probabilidade e estatistica evolufam. 

Ainda hoje, Bayes e criticado por incluir a subjetividade no ajuste dos 
calculos. Sob o ponto de vista dos matematicos conservadores e focados na 
objetividade, basear-se no "achismo" e na intuigao nao e correto. 

Atualmente, o Teorema de Bayes pode ser aplicado em quase todas as areas 
do conhecimento, nas pesquisas cientificas ou no cotidiano das pessoas. Auto- 
ridades de saude publica nao podem deixar de usar os calculos probabilfsticos 
na previsao de alcance de uma epidemia. 

As economias mundiais nao vivem mais sem a previsao de inflagao, de- 
semprego ou da alta ou baixa da cotagao das moedas. Apesar de sempre terem 
sido criticados, Thomas Bayes e suas ideias continuam desafiando a intuigao e 
o "achismo" nas apostas e palpites diarios. 
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2.1 O Teorema de Bayes 

Com base no que voce estudou ate aqui, lembre-se de que a probabilidade 
condicional permite obter a probabilidade de ocorrer um evento A, dado que 
ocorreu o evento B anterior a A. 

Porem, voce tambem pode querer saber o contrario, ou seja, a probabili¬ 
dade de um evento anterior A ter ocorrido, sabendo que um evento posterior 
B ocorreu. 

Sendo assim, oTeorema de Bayes relaciona a probabilidade de ocorrer um 
evento posterior a probabilidade de um evento anterior ter ocorrido. 

Seja um espaqo amostral S subdividido em varios eventos AT, A2, A3,..., Ak 
que satisfaqam as propriedades: 

j A; n Aj = 0 para i * j, em que todos os eventos A : sao mutuamente 
exclusivos. 

j U Aj = S em que a uniao de todos os eventos A, e igual ao espaqo amostral. 

j P(A) > 0 para todo i, em que a probabilidade de qualquer evento A, e 
maior que zero. 

Alem disso, B e um evento qualquer de S. 

Observe um caso particular de k = 4 e depois entenda a generalizaqao da 
ideia. 


Figura 3.2 Generaliza^ao do Teorema de Bayes 



Fonte: Da autora (2014). 


Observe que a probabilidade de ocorrer o evento B, representado na figura 
pela area elfptica mais escura, e: 

P(B) = P(B n A,) + P(B n A 2 ) + P(B n A 3 ) + P(B n A 4 ) (a) 


5 25 


50 


75 100 
















96928-978-85-68075-12-8 METODOS_QUATITATIVOS_ALTA_25_06_2014.pdf, page 41 @ Preflight - 14:16:30 - June 30, 2014 - PG-129 


Calculo de probabilidades 121 


Essa igualdade e valida porque todos os A, sao mutuamente exclusivos dois 
a dois. 

Observe, ainda, que a probabilidade de ocorrer o evento B, dado que ocor- 

PfBoA ) 

reu, por exemplo, o evento A1, e P(B/A 1 )= ) ou que a probabilidade 

de ocorrer B e A1 e P(B n Ad = P(Ad. P(B/Ad. 

Portanto, a probabilidade de ocorrer B e Aj sera: 

P(BnA,) = P(A,). P(B/Ad (b) 

Substituindo (b) em (a), temos: 


P(B) = P(Ad. P(B/Ad + P(A 2 ). P(B/A 2 ) + P(A 3 ). P(B/A 3 ) + P(A 4 ). P(B/A 4 ) 

Para saber a probabilidade de ocorrer, por exemplo, A1, dado que ocorreu 
B, e: 


P( A !E)~ P(A>nB) ~ _ P(A,)J»(B/A,) _ 

1 P( B) P(A 1 )P(B/A 1 ) + P(A 2 )P(B/A 2 ) + P(A 3 ).P(B/A 3 ) + P(A 4 ).P(B/A 4 ) 

Generalizando, para k € N, sendo k > 1, tem-se a formula doTeorema de 
Bayes: 

m/c )- p(A ' nB) -_ m,)-c( b/a,) _ 

P(B) C(Aj).P(B/ A,) + P(A 2 )i 3 (B/ A 2 )+ ...+P(A k ).P(B/ A k ) 

O Teorema de Bayes tambem revela oTeorema da Probabilidade Total no 
denominador e representa a probabilidade de ocorrer o evento B. 


2.1.1 Exemplos de aplicafoes do teorema de Bayes 

Exemplo 1 : 

Imagine que voce esta diante de duas urnas. Uma urna (U1) contem 4 bolas 
amarelas e 3 pretas. Uma segunda urna (U2) contem 6 bolas amarelas e 2 pretas. 

Escolhe-se uma urna ao acaso e dela se retira uma bola, tambem ao acaso, 
verificando-se que ela e amarela. Qual e a probabilidade de ela ter vindo da 
urna U1 ? 

Resol uqao: 

Lembrando que existem duas urnas, considere A o evento: sair bola amarela. 

j A probabilidade de escolher uma das urnas e 1/2. 

P(U1) = P(U2) = 1/2. 
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_i A probabilidade de sair bola amarela, dado que se escolheu a U1, e 4/7. 
P(A/U1) = 4/7 

_l A probabilidade de sair bola amarela, dado que se escolheu a U2, e 6/8. 
P(A/U2) = 6/8 = 3/4 

Voce quer saber a probabilidade de a bola ter vindo da Ul, dado que saiu 
uma bola amarela, ou seja, P(U1/A) = ?. 

Aplique oTeorema de Bayes: 


P(UJ A) = 


P(UJ A): 


P(U, nA) _ 
P(A) 

1 4 
2'7 

14 13 

2 '1 2'4 


Piu.mA/u,) 


/>(£/,) .P( A/ £/,) + i>(£/ 2 ) P( A/ U 2 ) 
4 4 

14 _ 14 _ 448 


4 3 
14 8 


74 

112 


1036 


= 0,4324 


Como a probabilidade de escolher as urnas e igual, a probabilidade de a 
bola sorteada ter safdo da U2 e maior que a probabilidade de ela ter safdo da 
Ul, pois a P(A/U2) e maior que a P(A/U1). 

Exemplo 2 : 

Considerando os mesmos numeros do exemplo 1, qual e a probabilidade 
de a bola escolhida ser amarela? 

Resoluqao: 

A = sair bola amarela. 

Voce devera calcular a probabilidade de ocorrer A, mas lembre-se de que A 
e um conjunto dividido em duas partiqoes do espaqo amostral. Ha uma parte 
das bolas brancas em Ul e outra parte em U2. Assim: 


P( A) = P(U l nA) + P(U 2 nA) = P(t/,) P(A/ 1/,) + P(U 2 ) J»(A/ U 2 ) = 


1 4 1 3 _ 4 3 _ 74 

_ 2 7 2 4 _ 14 8 _ 112 


0,6607 


Veja: o que se fez foi apenas aplicar oTeorema da Probabilidade Total. A 
resposta e igual ao denominador doTeorema de Bayes do exemplo 1. Confira! 
Exemplo 3 : 

Uma empresa possui 4 maquinas que fazem os mesmos tipos de peqas (X, 
Y, Z) e que se distinguem pela nacionalidade. A probabilidade das peqas de- 
feituosas de cada maquina e apresentada no seguinte quadro: 
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Quadro 3.2 Nacionalidade das maquinas e pe^as defeituosas 


Nacionalidade da maquina 

Probabilidade de pegas defeituosas 

X 

Y 

Z 

Americana 

0,15 

0,21 

0,10 

Brasileira 

0,10 

0,20 

0,15 

Chinesa 

0,12 

0,18 

0,20 

Dinamarquesa 

0,15 

0,11 

0,15 


Fonte: Da autora (2014). 


Escolhendo uma maquina, ao acaso, e retirando aleatoriamente uma peqa, 
verificou-se que e uma peqa do tipo Y com defeito. Qual e a probabilidade de 
essa peqa ter sido produzida pela maquina brasileira? 

Resol uqao: 

Admitindo que cada maquina tern a mesma chance de ser escolhida, tem-se 
que: P(A) = P(B) = P(C) = P(D) = 1/4 = 0,25. 

A 3 a coluna do quadro anterior indica a probabilidade de a peqa Y com 
defeito ser produzida por uma dada maquina. Entao, as probabilidades condi- 
cionais da peqa Y defeituosa de cada maquina sao: 

P(Y/A) = 0,21 P(Y/E>) = 0,20 P(Y/C) = 0,1 8 P(Y/D) = 0,11 

Assim, a probabilidade de a peqa Y ter sido produzida pela maquina brasi¬ 
leira, dado que a peqa e defeituosa, e: 


P(B/Y) = 
P(B/Y) = 


P(B).P(Y/B) 


P(A).P(Y / A) + P(B).P(Y / B) + P(C).P(Y / C) + P(D).P(Y / D) 
0,25.0,20 0,05 


0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,25.0,11 0,175 


= 0,2857 


Assim, pode-se calcular, da mesma maneira, a probabilidade de a peqa Y 
ter sido produzida em qualquer outra maquina, dado que a peqa e defeituosa. 


P(A/Y) = 
P(C I Y) = 
P(D/Y) = 


_ 0,25.0,21 _ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,25.0,11 
_ 0,25.0,18 _ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,25.0,11 
_0,25.0,18_ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,25.0,11 


0,0525 
0,175 
0,045 _ 
0,175 ’ 
0,0275 
' 0,175 


= 0,30 
0,2571 
= 0,1571 
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Para saber metis 


0 denominador (0,175), que e o mesmo em todos os casos, representa a probabilidade de 
escolher, ao acaso, uma peqa Y com defeito. Observe que a soma das probabilidades das quatro 
maquinas e 1. 


Analisando as quatro probabilidades calculadas anteriormente, veja que a 
peqa Y com defeito tem mais chance (30%) de ter sido produzida pela maquina 
americana do que por qualquer uma das outras. 

Esse fato tambem poderia ter sido percebido analisando-se o quadro de 
probabilidade de peqas defeituosas, uma vez que a probabilidade de escolher 
qualquer maquina e igual, e a probabilidade de a maquina americana produzir 
uma peqa Y defeituosa P(Y/A) e maior do que a das outras maquinas. 

Agora, se em vez de a empresa ter comprado a maquina chinesa, tivesse 
optado por mais uma dinamarquesa, sera que a peqa Y com defeito teria mais 
chance de ter sido produzida pela maquina americana? Verifique isso no se- 
guinte exemplo. 

Exemplo 4 : 

Considerando a mesma situaqao do exemplo 3, mas com duas maquinas 
dinamarquesas, qual maquina tem mais chance de ter produzido a peqa Y com 
defeito? 


Quadro 3.3 Nacionalidade das maquinas e pe^as defeituosas 


Nacionalidade da maquina 

Probabilidade de peqias defeituosas 

X 

Y 

z 

Americana 

0,15 

0,21 

0,10 

Brasileira 

0,10 

0,20 

0,15 

Chinesa 

0,15 

0,11 

0,15 

Dinamarquesa 

0,15 

0,11 

0,15 


Fonte: Da autora (2014). 


Resoluqao: 

Veja que aumentou a chance de a maquina escolhida ser a dinamarquesa: 
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p ( A ) = | 
4 

P(B) = - 
4 

P(D) = I 
2 


As probabilidades condicionais continuam as mesmas: 

P(Y/A) = 0,21 P(Y/B)= 0,20 P(Y/D) = 0,11 

Calculando a probabilidade de a pega Y ter sido produzida por cada uma 
das maquinas, dado que a pega e defeituosa: 


P(AJY) = 
P(B/Y) = 
P(D/Y) = 


_0,25.0,21_ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,5.0,11' 
_ 0,25.0,18 _ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18 + 0,5.0,11 ‘ 
_ 0,25.0,18 _ 

0,25.0,21 + 0,25.0,20 + 0,25.0,18+0,5.0,11 


0,0525 
0,1575 
0,045 
0,1575 : 

0,055 
’ 0,1575 


0,3334 
0,3175 
= 0,3492 


Apesar de a maquina americana ter maior probabilidade de produzir uma 
pega Y defeituosa, a pega Y com defeito tern mais chance (34,92%) de ter sido 
produzida pela maquina dinamarquesa. 

Isso nao quer dizer que o fato de ter mais maquinas do tipo dinamarquesa 
sempre contribuira para que isso acontega, pois, se a probabilidade de a ma¬ 
quina dinamarquesa produzir uma pega Y defeituosa P(Y/D) fosse de 0,10, 
a pega Y com defeito teria mais chance de ter sido produzida pela maquina 
americana. 
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i 

Questoes para reflexao 

Voce ja parou para pensar que a probabilidade de algo ocorrer ou nao 
faz parte da nossa vida diaria? 

Por exemplo, qual e a probabilidade de voce encontrar um amigo que 
nao ve ha anos? Qual e a chance de voce investir em algum negocio e 
ele dar resultado ja no primeiro ano? Qual e a probabilidade de voce 
encontrar o amor da sua vida nos corredores da faculdade? Ou mesmo, 
qual e a chance de voce ganhar na loteria? Claro, todos pensamos 
nessas chances ou probabilidades nao e mesmo? 

Para ajuda-lo, acesse o link http://economia.ig.com.br/fisico-usa- 
-probabilidades-para-mostrar-como-o-acaso-influencia-o-mundo/ 
nl 597200937269.html e conheqa o que o ffsico norte-americano 
Leonard Mlodinow, de 56 anos, acredita e defende. Alias, ele mesmo 

se intitula fruto do acaso, ou da sorte. Afinal, segundo o ffsico, ele nas- 
ceu porque seu pai sobreviveu a 2 a Guerra Mundial e sua vida sempre 
foi cheia de acontecimentos probabilfsticos. 

Mas, na sua opiniao, isso pode ser utilizado a nosso favor? Realmente, a 
matematica faz sentido para acontecimentos tao subjetivos? E o acaso? 
Ele realmente existe? Reflita, pense, e procure equilibrar a importancia 
da probabilidade numerica com o acaso. Quern sabe nao seria esse o 
segredo dos nossos passos futuros... Quern sabe?! 




Atividades de aprendizagem 


1. Segundo um professor de probabilidade, a chance de um aluno se dar 
bem em uma prova e de 80% se estudou e de 50% se nao estudou. Se 
um determinado aluno nao estuda para 15% das provas que realiza, 
qual sera a probabilidade de esse aluno se dar bem na prova? 

2 . Considerando os dados da questao anterior, qual a probabilidade de 
o aluno ter estudado, dado que ele se deu bem na prova? 
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j Espaqo Amostral (chamado S) e o conjunto de todas as solugoes possiveis 
relativas a um experimento qualquer. 
j Evento e uma parte do Espago Amostral. 
j A probabilidade de ocorrer um evento A e identificada como: 


P(A)= 


n(A) 

n (S) 


numero de resultados associados ao evento A 
numero de resultados possiveis 


j A probabilidade da uniao entre dois eventos A e B sera: 

P(A n B) = P(A) + P(B), se A e B sao mutuamente exclusivos. 

P(A n B) = P(A) + P(B) - P(A n B), se A e B sao mutuamente exclusivos. 
j A probabi I idade de ocorrer o evento B, dado que ocorreu o evento A, e: 


P(A/B)= 


P(AnB) 

P(A) 


j A probabilidade de ocorrerem os eventos A e B e: 

P(A n B) = P(A) • P(B/A), se A e B sao eventos dependentes 
P(A nB) = P(A) • P(B), se A e B sao eventos independentes 
j Teorema de Bayes 

A probabilidade de ocorrer um anterior evento Ai, dado que ocorreu 
um evento posterior B, e: 


P(Aj/B) 


_P(A i )-P(B/A i )_ 

PtAd-PiB/A,) + P(A 2 )-P(B/A 2 ) + ... + P(A k )-P(B/A k ) 


j Teorema da Probabilidade Total (denominador doTeorema de Bayes) 
A probabilidade de ocorrer o evento B e: 

P(A,) ■ PIB/Ad + P(A 2 ) ■ P(B/A 2 ) + ... + P(A k ) • P(B/A k ) 
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Para concluir o estudo da unidade 


Nesta unidade, voce pode conhecer os conceitos basicos da probabilidade, 
o espaqo amostral e o evento. Com isso, fez a relaqao de que temos uma 
parte (evento) de um todo (espaqo amostral) e, com esses dois conceitos, 
podemos calcular qualquer probabilidade, seja em uniao de eventos ou 
em situaqoes de eventos condicionados. 

Outro conteudo que voce estudou foi oTeorema de Bayes. Primeiro, voce 
conheceu o proprio Thomas Bayes e sua trajetoria no estudo e aprimora- 
mento das probabilidades. Depois, teve contato com o teorema, que trata da 
probabilidade de ocorrer um evento dado que ocorreu um evento posterior. 

Por exemplo, em uma empresa que fabrica pegas, voce foi fazer uma 
inspegao nas maquinas de diversas marcas e, escolhendo uma maquina 
ao acaso e retirando aleatoriamente uma pega, voce percebeu que e uma 
pega com defeito. Qual e a probabilidade de essa pega ter sido produzida 
pela maquina da marca X? Com isso, voce poderia identificar que a ma¬ 
quina da marca X nao e boa, pois produz pegas defeituosas em numeros 
maiores do que a maquina da marca Y, por exemplo. 

Enfim, a probabilidade serve para auxiliar na tomada de decisoes. 
Como futuro administrador, voce passara por situagoes em que o raciocfnio 
matematico e probabilistic sera necessario para saber que decisao tomar. 
Esperamos que o estudo desta unidade tenha Ihe permitido perceber isso 
e que voce possa realmente por em pratica o aprendizado. Desejamos um 
excelente curso e que voce seja um profissional brilhante e de sucesso! 



1. No famoso jogo de loteria "mega-sena", sao sorteadas 6 dezenas. 
Voce pode montar seu jogo escolhendo algumas entre as 60 dezenas. 
Supondo que voce escolheu 10 dezenas, qual e a probabilidade de 
voce acertar: 
a 4 dezenas? 

b) 5 dezenas? 

c) 6 dezenas? 
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2. Voce jogou dois dados perfeitos e pretende analisar a soma das faces 
voltadas para cima. Qual e a probabilidade de essa soma ser 6? 

3. Em um sorteio de um numero natural de 1 a 150, qual e a probabi¬ 
lidade de sair um numero multiplo de 10 ou de 1 5? 

4. No lanqamento simultaneo de um dado honesto e uma moeda ho- 
nesta, qual e a probabilidade de se obter um 5 ou uma cara? 

5. Uma urna contem 9 bolas verdes numeradas de 1 a 9 e 6 bolas azuis 
numeradas de 10 a 15. Se voce, ao acaso, retirar uma das bolas, qual 
sera a probabilidade: 

a) De sair uma bola verde? 

b) De sair uma bola com numero fmpar? 

c) De sair uma bola azul com numero par? 

6 . Uma maquina produziu 200 peqas, das quais 25 estavam com de- 
feito. Ao retirar, aleatoriamente, 4 peqas, com reposiqao, qual e a 
probabilidade de que: 

a) Todas sejam perfeitas? 

b) Todas tenham defeito? 

c) Pelo menos uma seja perfeita? 

d) Pelo menos uma tenha defeito? 


7. Numa sala de aula com 28 estudantes, 15 sao meninos e 12 sao mo- 
renos, dos quais 7 sao meninas. Escolhendo um estudante ao acaso, 
qual e a probabilidade de ele ser moreno ou menina? 


8. A probabilidade de que o filho de um casal nasqa com olhos verdes 

e de - . Se o casal tiver tres filhos, qual e a probabilidade de todos 

terem olhos verdes? E de nenhum ter olhos verdes? E de, pelo menos 
um ter olhos verdes? 


9. Um grupo de 83 estudantes apresenta, de acordo com o sexo e a 
altura, a seguinte situaqao: 

Quadro 3.4 Altura dos estudantes 



Menos de 1,40m 

De 1,40m a 1,60m 

Mais de 1,60m 

Meninos 

15 

12 

8 

Meninas 

11 

24 

13 


Fonte: Do autor (2014). 
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Escolhendo uma pessoa desse grupo ao acaso, determine: 

a) A probabilidade de ser um menino. 

b) A probabilidade de ser uma menina com menos de 1,40m. 

c) A probabilidade de ser um menino, se o escolhido tiver de 1,40m 
a 1,60m. 

d) A probabilidade de ser uma menina, se o escolhido tiver no ma- 
ximo 1,60m. 


10 . Uma prova e composta por 15 questoes, e cada uma possui 4 al- 
ternativas, das quais apenas uma e correta. Para alguem que esteja 
respondendo aleatoriamente uma alternativa em cada questao, qual 
e a probabilidade de: 

a) Acertar as 15 questoes? 

b) Errar as 15 questoes? 


c) 


Acertar 


2 

3 


das questoes? 


11 . Uma caixa em forma de urna contem 5 bolas azuis e 3 rosas. Uma 
segunda caixa contem 3 bolas azuis e 2 rosas. Se uma bola branca e 
sorteada ao acaso, qual e a probabilidade de ela ter vindo da primeira 
caixa? 

12 . Tres empresas de brinquedos A, BeC, produziram, respectivamente, 
40%, 50% e 10% do total de brinquedos de uma escola. A porcen- 
tagem de brinquedos defeituosos da fabrica A e de 3%, da fabrica 
B e de 5% e da fabrica C e de 2%. Uma crianqa recebeu, ao acaso, 
um brinquedo defeituoso. Qual e a probabilidade de que essa peqa 
tenha vindo da fabrica B? Qual das empresas tern mais chance de ter 
fabricado a peqa defeituosa? 

13. Considerando os dados da questao anterior, determine qual e a pro¬ 
babilidade de uma crianqa receber um brinquedo defeituoso. 

14. Considere a existencia de tres urnas. A primeira urna contem 9 bolas: 
3 pretas, 1 branca e 5 vermelhas; a segunda contem 9 bolas: 4 bolas 
pretas, 3 brancas e 2 vermelhas; finalmente, a terceira urna contem 
8 bolas: 2 pretas, 3 brancas e 3 vermelhas. Escolheu-se uma urna, 
ao acaso, e dela se extraiu uma bola ao acaso. Verificando-se que a 
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bola sorteada e branca, qual e a probabilidade de a bola ter saido da 
terceira urna? 

15. O proprietaries de uma faeqao estima que uma roupa feita por um 
funcionario experiente tern 90% de chance de nao apresentar de- 
feito, e que uma roupa feita por um funcionario novato tern 50% de 
chance de nao apresentar defeito. Se uma roupa selecionada ao acaso 
apresentar defeito, determine a probabilidade de ela ter sido feita por 
um funcionario novato, sabendo-se que 2/3 das roupas sao feitas por 
funcionarios experientes. 
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Unidade 4 


Calculos estatisticos 


Debora Cristina Brandt 


Objetivos de aprendizagem: Nesta unidade, voce sera levado a 
conhecer, diferenciar e calcular a media simples e a media ponde- 
rada, bem como realizar a regressao linear a partir do metodo de 
minimos quadrados. 


j Segao 1: Media e media ponderada 

Tanto a media como a media ponderada nos forne- 
cem uma medida resumo dos dados obtidos em uma 
pesquisa estatistica. Veremos nesta segao qual a dife- 
renga entre os dois e aprenderemos como calcula-los. 

j Segao 2: Variancia e desvio-padrao 

A variancia e uma medida de dispersao de dados de 
uma pesquisa estatistica em torno da media. Nesta 
segao, iremos aprender a calcula-la, assim como, 
tambem, aprenderemos a calcular o desvio-padrao. 


j Segao 3: Correlagao e regressao linear 

A correlagao e uma medida que mede a dependence 
linear entre duas variaveis em uma mesma pesquisa 
estatistica. Se houver dependence, poderemos en- 
contrar a equagao da reta que melhor descreva essa 
situagao atraves da regressao linear. 
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Introdu^ao ao estudo 


Nas unidades anteriores, voce aprendeu a apresentar os dados referentes as 
variaveis estatfsticas por meio de tabelas e graficos. Embora essa representaqao 
ajude a tirar conclusoes sobre o que foi pesquisado, existem outras maneiras 
complementares a elas que permitem extrair informaqoes: sao os chamados 
calculos estatisticos. 

Quando estudamos uma variavel em particular, podemos resumir as in- 
formaqoes apresentadas em uma tabela por media e da variancia dos dados. 
Assim, conseguimos expressar atraves de dois numeros o comportamento da 
variavel em estudo. 

No caso de estudarmos tabelas de dupla entrada, onde estamos interessados 
nao so no comportamento da variavel, mas na maneira como uma influencia 
o comportamento da outra, podemos calcular a correlagao linear entre elas, 
isto e, e possfvel quantificar a dependencia linear entre duas variaveis. Se elas 
estiverem correlacionadas linearmente, podemos representa-las por meio de 
um grafico e aproxima-las utilizando para isso a regressao linear. Serao esses 
conceitos que estudaremos nesta unidade. 

Na primeira seqao, apresentaremos os conceitos de media e media pon- 
derada, qual a diferenqa entre os dois e como calcula-los. Na segunda seqao, 
aprenderemos a calcular a variancia e o desvio-padrao de uma variavel, que 
quantifica a dispersao dos valores observados em torno da media. Ja na terceira 
segao, estudaremos a correlagao linear entre duas variaveis e a maneira de 
relaciona-las via regressao linear. 


Segao 1 


Media e Media Ponderada 


Suponha que voce esta indo, pela primeira vez, consultar determinado den- 
tista. Ao chegar la, observa que, embora seu horario esteja se aproximando, ha 
uma quantidade razoavel de pessoas na sala de espera — ou seja, a consulta 
ira atrasar. Como voce e uma pessoa ocupada e sabe que vai ter que voltar la 
inumeras vezes, gostaria de ter uma ideia do quanto as consultas costumam 
atrasar. Entao, voce resolve perguntar para a secretaria a respeito. Ao perguntar 
isso, nem passa pela sua cabeqa que a secretaria vai Ihe fornecer uma lista com 
todos os atrasos para aquele horario no ultimo ano ou mes. Na verdade, ela vai 
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[he dar uma unica informagao que vai fazer com que voce tenha sua pergunta 
razoavelmente respondida. Essa e a ideia das medidas de posigao, ou medidas 
de tendencia central para um conjunto de dados qualquer. 

Suponhamos que o dentista tambem esteja atento a essa questao e resolveu 
pedir para sua secretaria anotar a quantidade de minutos que cada paciente tem 
que esperar pra ser atendido. No dia anterior a sua consulta, por exemplo, foram 
atendidas 20 pessoas, e os atrasos observados (em minutos) foram os seguintes: 

10 15 8 15 22 15 30 21 15 18 

33 42 45 22 15 18 22 25 18 22 

Vamos partir desses valores para entender o significado de cada medida de 
posigao que apresentaremos a seguir. 

1.1 Media aritmetica 

A media aritmetica e uma medida de posigao para variaveis quantitativas 
e e obtida somando-se todos os valores observados e dividindo-se o resultado 
pelo numero de observagoes. Formalmente, se X for uma variavel com observa¬ 
goes x,, x 2 , x n , chamamos de media de X a soma dos valores dividida pelo 
numero de observagoes, ou seja, 

_ X,+X,+...+ X 

x = —---- 

n 

Vamos calcular o tempo medio de espera no dentista? 

A variavel em questao e o tempo de espera, em minutos, e o numero de 
observagoes e n = 20. Assim, 

_ x, + x 2 + ... +x 10 +15 + 8 +15 + 22 +... +22 + 25 +18 + 22 431 

x = —---- =-=-= 21,55 

n 20 20 

Portanto, o tempo medio de espera no dentista naquele dia foi de 21,55 min. 
Observe que o valor encontrado para a media nao foi observado: de acordo 
com os dados obtidos pela secretaria, ninguem esperou 21,55 min naquele dia. 
Na verdade, o valor medio nao precisa ser igual a um dos dados observados 
na pesquisa. 
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1.2 Media ponderada 

Para calcularmos o tempo medio de atraso, realizamos uma soma com 20. 
Uma maneira mais eficiente de calcular a media e atraves da distribuigao de 
frequencias. Nesse caso, poderemos agrupar os dados que aparecem mais de 
uma vez. 

Vamos montar a tabela para o nosso exemplo: 

Tabela 4.1 Exemplo de media aritmetica 


Atraso no dentista no dia 'a' - 2014 


Tempo (min) 

ni 

8 

i 

10 

i 

15 

5 

18 

3 

21 

1 

22 

4 

25 

1 

30 

1 

33 

1 

42 

1 

45 

1 

Total 

20 


Fonte: Dados fictfcios. 


Assim, em vez de somarmos 20 + 20 + 20 + 20, fazemos 4x20. E, dessa 
forma, em vez de realizarmos uma soma com 20 parcelas, faremos uma soma 
com 11 parcelas. 


_ 1- 8 + 1- 10 + 5- 15 + 3- 18 + ...+ 1- 45 

x - - 

20 


431 

~20 


21,55 


Damos a essa maneira de calcular media o nome de media aritmetica. For- 
malmente, se X for uma variavel com observagoes x,, x 2 ,..., x,, cujas frequencias 
observadas sao n 1r n 2 , ..., n k , respectivamente, com k< n, calculamos a media 
de X como: 
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ft, ■ x,+ft 2 - x 2 + ...+n k - X k 
ft, +ft 2 + ...+n k 

ou, ainda, 

ft, • x,+ft 2 - x 2 +...+n k - x k 

ft 


-' 6 - 

Questdespara reflexao 


Por que as duas equaqoes propostas para a media ponderada sao 
equivalentes? 


Exemplo 2: Considere a seguinte tabela estatistica: 


Tabela 4.2 Exemplo de media ponderada 


Numero de vestibulares prestados antes da aprovacao 


Numero de vestibulares 

Ni 

0 

28 

1 

54 

2 

40 

3 

10 

4 

8 

Total 

140 


Fonte: Dados fictfcios. 


Vamos calcular a quantidade media de vestibulares prestados. 

_ ft, ■ x { +n 2 - x 2 + ... + n k ■ x k 0- 28 + 1- 54 + 2- 40 + 3- 10 + 4- 8 196 

ft, +ft 2 + ...+n k 140 140 

Note que, se os dados nao tivessem agrupados, o trabalho seria razoavel, 
pois o numero de dados observados e de 140. Entretanto, como os dados estao 
agrupados na tabela de frequencia, temos uma soma com 5 parcelas. 

Vamos criar uma coluna auxiliar na tabela para facilitar o trabalho. Observe: 
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Tabela 4.3 Tabela auxiliar para o calculo da media ponderada 


xi 

ni 

X, • rii 

0 

28 

0-28 = 0 

1 

54 

1-54 = 54 

2 

40 

2-40 = 80 

3 

10 

3-10 = 30 

4 

8 

4-8 = 32 

Total 

140 

196 


Fonte: Dados fictfcios. 


Assim, calcular a media resume-se a tomarmos a razao 196/140 = 1,4. 

E se a variavel for quantitativa contfnua? 

Se os dados nao estiverem agrupados, basta aplicar a definiqao de media: 
somamos todos os dados observados e dividimos pela quantidade de dados 
observados. Mas e se os dados estiverem agrupados em uma distribuiqao de 
frequencia? 

Exemplo: Considere a tabela de distribuiqao de frequencia a seguir. 


Tabela 4.4 DistribuRao de intervalos de classe 


Altura dos estudantes da classe 2013 



ni 

128 |—131 

3 

131 |—134 

7 

134 |—137 

5 

137 |—140 

4 

1401— 144 

1 

Total 

20 


Fonte: Dados fictfcios. 


Sabemos que ha 3 estudantes na classe com altura entre 128 cm e 131 cm, 
mas nao sabemos quantos medem, exatamente, 128 cm ou 129 cm. Para cal- 
cularmos a media, nesse caso, precisamos eleger um representante para cada 
classe, um numero que utilizaremos para realizar os calculos — no caso, o 
ponto medio do intervalo (URBANO, 2010, p. 98). Depois, basta proceder 
como anteriormente. 
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Tabela 4.5 Tabela auxiliar 



xi 

ni 

Xj • ri; 

128 |—131 

129,5 

3 

388,5 

131 |—134 

132,5 

7 

927,5 

134 1—137 

135,5 

5 

677,5 

137 |—140 

138,5 

4 

554 

140|—144 

141,5 

1 

141,5 

Total 


20 

2689 


Logo, a altura media dos estudantes da classe em 2013 foi de 2989/20 = 
134,45 cm. 

A media ponderada pode ser aplicada tambem quando queremos dar pesos 
diferentes a valores. 

Exemplo: na composiqao de uma nota semestral, o professor responsavel 
quer realizar 3 provas, mas quer que a primeira tenha peso 1 e a segunda e 
a terceira tenham peso 2. Se considerarmos N,, N 2 , N 3 como sendo as notas da 
primeira, da segunda e da terceira avaliaqoes respectivamente, o calculo da 
media ponderada sera: 

__ 1 ■ Af,+2- N 2 +2- N 3 _ l- A,+2- N 2 +2- N 3 
X ~ (1 + 2 + 2) “ 5 

Suponhamos que um estudante tenha tirado 3, 7 e 8 na primeira, segunda 
e terceira prova respectivamente. Sua media sera, entao, 

_ 1- 3 + 2- 7 + 2- 8 1- 3 + 2- 7 + 2- 8 33 ^ 

x = -=-= — = 6,6 




Questdespara reflexao 


Qual a interpretaqao que pode ser dada aos pesos das notas em termos 
de tabela de frequences? 
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_ 


J Atividades de aprendizagem 

1. Um banco instalou um caixa eletronico em um posto de combustfvel 
e esta observando o numero de usuarios que vem utilizando o serviqo. 
Diariamente, o numero de clientes que utilizou o serviqo nos ultimos 
32 dias foi: 


15 

17 

16 

15 

17 

14 

17 

16 

16 

17 

15 

18 

14 

17 

15 

14 

15 

14 

15 

16 

17 

18 

18 

17 

15 

16 

14 

18 

18 

16 

15 

14 






Qual o numero medio de clientes que utilizaram o serviqo no perfodo? 

2. Exercfcio adaptado de (MAGALHAES, 2010): O valor medio de co- 
mercializaqao da saca de milho de 60 quilos na BM&F e apresentado 
abaixo, em reais, para os ultimos 40 meses. 


6,1 

6,2 

6,7 

6,5 

6,9 

6,3 

7,4 

7,6 

7,7 

7,6 

7,3 

7,7 

7,6 

7,4 

7,2 

7,2 

7,3 

7,6 

7,5 

7,4 

7,5 

7,7 

8,2 

8,3 

8,1 

8,1 

8,1 

7,9 

7,8 

7,4 

7,5 

7,6 

7,5 

7,6 

7,4 

7,3 

7,4 

7,5 

7,5 

7,4 


Organize os dados em faixas de tamanho 0,4 a partir de 6. Calcule 
o valor medio de comercializaqao no perfodo. 



Para saber mais 


E muito importante que saibamos interpretar os dados estatfsticos que nos cercam. Interpreta- 
goes erroneas podem nos levar a condusoes erradas e, ate mesmo, absurdas. Nesse sentido, 
sugerimos o texto de autoria do prof. dr. Marcelo Menezes Reis, que trata justamente de como 
interpretar os dados estatisticos que nos cercam. Voce pode acessa-lo em: http://www.inf.ufsc. 
br/~marcelo/contest.html>. 
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Variancia e desvio-padrao 


Voces ja devem ter ouvido falar no bairro do Morumbi, em Sao Paulo. Esse 
bairro e considerado de classe media alta: o Joquei Club fica no Morumbi, o 
Palacio dos Bandeirantes — sede do governo do estado —, o Shopping Cidade 
Jardim, que e um dos mais caros — senao o mais caro — shopping da cidade. 
Mas nesse bairro tambem fica a maior favela de Sao Paulo: a Paraisopolis. 

Se fosse feita uma pesquisa sobre a renda dos paulistanos de acordo com 
o bairro em que eles moram, possivelmente a renda media dos moradores do 
Morumbi seria muito boa, mas sera que seria representativa? 

Muitas vezes, as medidas de posiqao por si so nao nos dao a informaqao 
completa e escondem discrepancias que deveriam ser conhecidas. Por essa 
razao, as medidas de posiqao precisam ser complementadas pelas medidas de 
dispersao, que nos dizem como os valores se distribuem em torno das medidas 
de posiqao. 

Assim como no caso das medidas de posiqao, existem varias medidas de 
dispersao. Nesta unidade, estudaremos a variancia e o desvio-padrao. 

2.1 Variancia e desvio-padrao populacional 

Segundo Magalhaes (2010), se X e uma variavel com observaqoes x v x 2 , 
..., x n , chamamos de variancia populacional desse conjunto de observaqoes a 
seguinte equaqao: 


(X -x) 2 +(x 2 - x) 2 + ...+ X -x) 2 


Var(X) = 


n 


Note que, para calcular a variancia, e necessario como primeiro passo 
obter a media. 

Exemplo: Suponhamos que os dados a seguir sao relativos ao tempo de es- 
pera em minutos para o atendimento medico em um consultorio em certo dia A. 

20 30 15 40 38 35 20 24 

Inicialmente, vamos calcular a media de tempo de espera: 

_ 20 + 30 + 15 + 40 + 38 + 35 + 20 + 24 _ _ . 

x =-= 27,75 mm 

8 

De posse da media, podemos calcular a variancia: 
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Var(X ) = ■ 

+ 


( 20 - 27 , 75) 2 + ( 30 - 27 , 75) 2 +( 15 - 27 , 75) 2 +( 40 - 27 , 75) 2 

8 

( 38 - 27 , 75) 2 +( 35 - 27 , 75) 2 + ( 20 - 27 ,' 75) 2 +( 24 - 27 , 75) 2 

8 


= 76,19 


O fato de termos elevado as diferengas ao quadrado faz com que nosso 
resultado seja dado em (min) 2 . Se tomarmos a raiz desse valor, voltaremos a 
ter um numero em minutos. Esse procedimento nos da o que chamamos de 
desvio-padrao: 

dp(X) = yJVar(X) 

No nosso caso, o valor do desvio-padrao sera dp(X) = ^76,19 = 8,73 min. 

Assim, o tempo medio de espera foi de 27,75min com um desvio-padrao 
de 8,73min. 

O que isso significa? 

Significa que o tempo medio de espera e de 27,75min e que os outros tem¬ 
pos de espera nao diferem mais do que 8,73min desse valor. 

Vimos que, quando a variavel esta sendo apresentada em uma tabela de 
frequences, o calculo da media e facilitado. A mesma coisa acontece com a 
variancia. 

Exemplo: Considere os dados a seguir, relativos a uma pesquisa sobre de- 
terminada variavel quantitativa. 


Tabela 4.6 Exemplo de variancia populacional 


Xi 

ni 

0 

7 

1 

3 

2 

4 

3 

2 

4 

0 

5 

5 

Total 

21 


Fonte: Dados fictfcios. 
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Primeiro, precisamos calcular a media dessa variavel fictfcia. Para isso, 
podemos utilizar uma tabela auxiliar: 

Tabela 4.7 Tabela Auxiliar 


Xi 

Ni 

Xj • rij 

0 

7 

0-7 = 0 

1 

3 

1 - 3=3 

2 

4 

2-4 = 8 

3 

2 

3-2 = 6 

4 

0 

4-0 = 0 

5 

5 

5-5 =25 

Total 

21 

42 


Fonte: Dados fictfcios. 


42 

Assim, a media sera x = — = 2. 

21 

Agora, precisamos calcular a variancia atraves da formula 


(jCj ~x) 2 +(x 2 -x) z + ...+(x n -x) 


—\2 


—\2 


Var(X) 


n 


■■ Novamente, uma tabela 


auxiliar tornara a realizagao desse calculo mais simples: 

Tabela 4.8 Tabela Auxiliar 


xi 

ni 

Xj • Hj 

Xj - X 

(X; - x) 2 

0 

7 

0-7 = 0 

-2 

4 

1 

3 

1-3 = 3 

-1 

1 

2 

4 

2-4 = 8 

0 

0 

3 

2 

3-2 = 6 

1 

1 

4 

0 

4-0 = 0 

2 

4 

5 

5 

5 • 5 = 25 

3 

9 

Total 

21 

42 


19 


Assim, 


Var(X) = — = 
21 


dp(X) = sJ 0,905 =0,951. 


0,905 e, portanto, o desvio-padrao e dado por 
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2.2 Variancia e desvio-padrao amostral 

A formula que vimos anteriormente e utilizada para o calculo da variancia 
e do desvio-padrao populacional, isto e, quando toda a populaqao foi consi- 
derada. Como normalmente trabalhamos com amostra, precisamos fazer um 
ajuste nos calculos por questoes tecnicas que fogem ao escopo deste caderno 
de estudos (para saber mais, consulte (MAGALHAES, 2010). Assim, a variancia 
amostral de um conjunto de observaqoes x v x 2/ x n e dada pela seguinte 
equaqao: 

S 2 ^ _ Ui - xf + (x 2 - xf +...+ (x n - xf 

n — 1 

Observe que a unica diferenga entre variancia populacional e amostral esta 
no denominador da formula. 

Exemplo: Se os dados a seguir sao relativos ao tempo de espera em minutos 
para o atendimento medico em um consultorio para uma amostra de pacientes 
(nao todos) em certo dia A, 

20 30 15 40 38 35 20 24 

a variancia sera dada por: 


t2 _ ( 20 - 27 , 75) 2 +( 30 - 27 , 75) 2 + ( 15 - 27 , 75) 2 +( 40 - 27 , 75) 2 | 

8-1 

( 38 - 27 , 75) 2 +( 35 - 27 , 75) 2 +( 20 - 27 , 75) 2 +( 24 - 27 , 75) 2 

7 


= 87,07 


O calculo do desvio-padrao nao muda: 

S(X) = ^S 2 (X) 

No nosso caso, o valor do desvio-padrao sera sfX) = ^87,07 = 9,33 min. 
Exemplo: Vamos calcular a variancia amostral da tabela a seguir, utilizando 
uma tabela auxiliar. 
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Tabela 4.9 Calculo da variancia amostral. 


Xi 

fi 

1 

6 

2 

0 

3 

6 

Total 

12 


Fonte: Dados fictfcios 


Tabela 4.10 Utilizando a tabela auxiliar 


xi 

fi 

X; • rij 

Xj - X 

(Xj - x) 2 

i 

6 

6 

-1 

1 

2 

0 

0 

0 

0 

3 

6 

18 

i 

1 

Total 

12 

24 


2 

Media x 


2 



Variancia Amostral 




0,182 

Desvio-padrao 

amostral 




0,426 


24 

Encontramos a media x = — = 2 , a variancia amostral 

12 


S 2 (X): 


( 12 - 1 ) 

S(X) = ^0,182 = 0,426 - 


0,182 e, finalmente, o desvio-padrao amostral 




Questdespara reflexao 


Voce consegue decidir quando devera utilizar a variancia amostral ou 
a variancia populacional em uma pesquisa cientffica? Pense em alguns 
exemplos de aplicaqao. 
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J Atividades de aprendizagem 

1. A prefeitura esta estudando a possibilidade de implantar um sema- 
foro em um cruzamento da cidade. Para decidir, resolveu considerar 
o numero de acidentes nos ultimos 12 meses nesse entroncamento, 
obtendo os seguintes valores: 

5478 56479768 

Encontre o desvio-padrao populacional. 

2 . Um banco instalou um caixa eletronico em um posto de combustf- 
vel e esta observando o numero de usuarios que vem utilizando o 
serviqo. Diariamente, o numero de clientes que utilizaram o serviqo 
nos ultimos 32 dias foi: 


15 

17 

16 

15 

17 

14 

17 

16 

16 

17 

15 

18 

14 

17 

15 

14 

15 

14 

15 

16 

17 

18 

18 

17 

15 

16 

14 

18 

18 

16 

15 

14. 



Calcule o desvio-padrao amostral para essa distribuiqao. 


Para saber mais 

Existem muitos livros que tratam da utilizagao da estatfstica no dia a dia e da importance em inter¬ 
pretar as informagoes da melhor maneira possivel. Um livro que faz a ponte entre a estatfstica e o 
calculo de risco e Desafio aos Deuses, de Peter L. Bernstein. Fica a dica de leitura! 
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Muitas vezes, ao realizarmos uma pesquisa estatfstica, nao nos interessa 
apenas o comportamento das variaveis isoladamente, mas, sim, o comporta- 
mento de duas ou mais variaveis ao mesmo tempo. Por exemplo: 

j A variaqao no valor do dolar em relaqao ao real afetou a importaqao de 
mercadorias? 

_l O aumento de investimento em turismo resultou em um aumento no fluxo 
de turistas? 

j A quantidade de agua adicionada a determinada marca de cimento afeta 
a qualidade do concreto resultante? 

j O aumento salarial para funcionarios de certa empresa afetou o volume 
de vendas? 

j O investimento na compra de maquinario reverteu positivamente no lucro 
de uma empresa? 

Nesta seqao, aprenderemos a relacionar duas variaveis e a verificar se ha 
algum tipo de relaqao entre elas: se o comportamento de uma afeta o compor¬ 
tamento da outra. 

3.1 Rela^ao entre variaveis 

Suponhamos que uma pesquisa detectou o numero de vestibulares prestados 
por cada estudante antes da sua aprovaqao em determinada universidade. Para 
que a pesquisa ficasse mais completa, foi perguntado tambem a cada um dos 
estudantes se ele trabalhava na epoca ou nao. Os dados obtidos com a pesquisa 
aplicada a 10 estudantes foram os seguintes: 


X 

1 

1 

2 

1 

1 

2 

3 

1 

1 

1 

Y 

Nao 

Sim 

Nao 

Nao 

Nao 

Sim 

Sim 

Nao 

Sim 

Sim 


onde X e a variavel 'numero de vestibulares prestados antes da primeira aprova- 
qao' e Y e a variavel 'trabalhava'. Imagina-se que o fato de trabalhar fora afete o 
desempenho do estudante nos vestibulares negativamente, ou seja, imagina-se 
que essas variaveis estejam relacionadas de alguma forma, mas olhando sim- 
plesmente para os dados sem agrupa-los fica diffcil tirar qualquer conclusao. 
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Uma tabela de dupla entrada poderia facilitar a analise. Para isso, vamos 
construir uma tabela auxiliar contendo as possibilidades conjuntas de X e Y e 
a frequencia observada de cada uma: 


Tabela 4.11 Tabela de possibilidades conjuntas 


(X,Y) 

ni 

(1, sim) 

3 

(1, nao) 

4 

(2, sim) 

1 

(2, nao) 

1 

(3, sim) 

1 

(3, nao) 

0 

Total 

10 


Fonte: Dados fictfcios. 


Agora, estamos em condiqoes de construir uma tabela de dupla entrada: 

Tabela 4.12 Tabela de dupla entrada 


Rela^ao entre vestibulares prestados antes da primeira aprova^ao e trabalho 


Numero de 
vestibulares 
prestados 

Trabalhava na epoca 

Total 

Sim 

Nao 

1 

3 

4 

7 

2 

1 

1 

2 

3 

1 

0 

1 

Total 

5 

5 

10 


A primeira e a ultima coluna nos dao o que chamamos de tabela marginal 
de X, e a primeira e a ultima linha nos dao a tabela marginal de Y. 

Tabela 4.13 Tabelas marginais 


xi 

ni 

y' 

Hi 

i 

7 

Sim 

5 

2 

2 

Nao 

5 

3 

1 

Total 

10 

Total 

10 
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Observe que nada mais sao do que as distributes de frequencia das va¬ 
riaveis X e Y, respectivamente. 

A tabela de dupla entrada permite, entao, visualizar o comportamento das 
duas variaveis ao mesmo tempo. Uma vez que sabemos esboqar a tabela de 
distribuigao conjunta de duas variaveis, a pergunta que se coloca agora e: como 
saber se o comportamento de uma influencia o comportamento da outra? Sera 
que ha relaqao entre elas? Sera que o comportamento de uma depende do 
comportamento da outra? 

Essas perguntas sao importantes porque, se as variaveis forem dependentes, 
podemos explicar como uma delas se comporta em funqao do desempenho 
da outra. 

Embora diffceis de responder por completo, ha algumas maneiras de che- 
garmos em respostas parciais para essas questoes. 

3.2 Diagrama de dispersao e a correla^o linear 

Para iniciarmos nossa discussao, consideremos uma amostra aleatoria das 
notas de Calculo e Estatistica de 12 estudantes do curso de Engenharia Eletrica 
de determinada universidade: 


Tabela 4.14 Grafico de dispersao 


Estudante 

Nota Calculo 

Nota Estatistica 

1 

4 

5 

2 

6 

7 

3 

7 

8 

4 

6 

5 

5 

9 

9 

6 

8 

8 

7 

8 

5 

8 

2 

4 

9 

2 

5 

10 

5 

4 

11 

4 

6 

12 

9 

8 


Fonte: Novaes e Coutinho (2009). 
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Queremos saber se ha relaqao entre os desempenhos em Calculo e Estatfs- 
tica. Para isso, vamos traqar o grafico de dispersao entre as duas variaveis. O 
primeiro passo e definirmos qual das variaveis ocupara a posiqao do eixo das 
abscissas (eixo horizontal X) e qual ocupara a posiqao do eixo das ordenadas 
(eixo vertical Y). Vamos considerar a variavel X como sendo 'nota de Calculo' 
e a variavel Y como sendo 'nota de Estatfstica'. Assim, os valores associados a 
nota de Calculo comporao as coordenadas x e os valores associados a nota de 
Estatfstica comporao as coordenadas y no par ordenado (x, y). 

Grafico 4.1 Grafico de dispersao 


NOTAS EM CALCULO E ESTATISTICA EM 
ENGENHARIA ELETRICA DA 
UNIVERSIDADE 



Notas em Calculo 


Fonte: Da autora (2014). 


O grafico de dispersao dos dados anteriores nos mostra que ha uma relaqao 
entre as notas em Estatfstica e Calculo: aparentemente, os alunos que possuem 
maiores notas em Calculo obtem melhores notas em Estatfstica e vice-versa. 
Assim, podemos arriscar a dizer que as variaveis sao correlacionadas. 

Segundo Crespo (2009, p.147), podemos dividir os casos de correlaqao 
entre variaveis em tres: 

_l Correlaqao linear positiva: quando o aumento da variavel independente 
X implica em um aumento na variavel dependenteY; 
j Correlaqao linear negativa: quando o aumento da variavel independente 
X implica em uma diminuiqao na variavel dependenteY; 
j Correlaqao nao linear: quando parece ter algum tipo de relaqao entre as 
variaveis em formato de 'curva'. 
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Figura 4.1 Tipos de correla<:ao. 


CCTTViw ^.' 1 I"TJI fKBft’tD 



EC4ur^,>:« rtfr: Iraai 


- F - - 





* * 



-Jn Ff ** 


Fonte: Crespo (2005, p. 147). 


Mas sera que e possfvel medir essa correlaqao entre variaveis? 


3.3 Coeficiente de correla 9 ao 

Vamos, agora, apresentar uma maneira de medir a correlaqao linear entre 
duas variaveis, chamada de coeficiente de correlaqao de Pearson, ou coeficiente 
de correlaqao linear. 

Formalmente, se X e Y sao duas variaveis discretas definidas a partir do 
mesmo fenomeno, com valores atribufdos (Xj, yd, (x 2/ y 2 ), ..., (x n , y n ), definimos 
o coeficiente de correlaqao de Pearson por: 



Aten^ao—OsfmboloXsignificasomatorio,ouseja, — x 1 +x 2 + ...+ x n 

i =1 

Note que a maior dependencia que poderia ocorrer entre duas variaveis 
X e Y seria X se comportar exatamente como Y: cada aumento da variavel X 
representaria um aumento de mesma quantidade de Y, ou uma diminuiqao de 
mesma quantidade de Y. Em termos de correlaqao, isso significa que -1 < r < 1. 
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Ja no caso de X e Y serem independentes linearmente, r = 0. Segundo Urbano 
(2010, p. 440), podemos considerar a seguinte escala para correlaqao: 


1,00 

0,75 

0,50 

0,25 

0,00 

-0,25 

-0,50 

-0,75 

- 1,00 


Correlaqao positiva perfeita 
Correlaqao positiva forte 
Correlaqao positiva media 
Correlaqao positiva fraca 
Nao existe correlaqao linear 
Correlaqao negativa fraca 
Correlaqao negativa media 
Correlaqao negativa forte 
Correlaqao negativa perfeita 


: 


Questdespara reflexao 


Se o coeficiente de correlaqao de Person para duas variaveis resultar 
em 0, podemos concluir que essas variaveis sao independentes? 


Observe que a formula da correlaqao linear e bastante trabalhosa. Entretanto, 
podemos utilizar uma tabela auxiliar para ajudar no calculo, assim como fize- 
mos para calcular a variancia. Voltando aos dados da tabela 4.14, e lembrando 
que X representa a variavel 'nota em Calculo' e Y representa a variavel 'nota 
em Estatfstica', construfmos a seguinte tabela auxiliar: 

Tabela 4.15 Tabela Auxiliar 


i 

*i 

Yi 

xi 2 

Vi 2 

Xj • rij 

i 

4 

5 

16 

25 

20 

2 

6 

7 

36 

49 

42 

3 

7 

8 

49 

64 

56 

4 

6 

5 

36 

25 

30 

5 

9 

9 

81 

81 

81 

6 

8 

8 

64 

64 

64 

7 

8 

5 

64 

25 

40 

8 

2 

4 

4 

16 

8 

9 

2 

5 

4 

25 

10 

10 

5 

4 

25 

16 

20 

11 

4 

6 

16 

36 

24 

12 

9 

8 

81 

64 

72 

Total 

70 

74 

476 

490 

467 


Fonte: Da autora (2014). 
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Da tabela auxiliar, temos: 


2 >. = 70 

i=l 

&?=476 


2>,=74 

1=1 

%■ = 490 


5 / 1 ' 7 / = 467 

i =1 


Agora, podemos calcular o coeficiente: 

12- 467-70- 74 


r 


12 ■ 476-(70) 2 • 12- 490-(74) 2 


= 0,74 


Observe que o valor encontrado para a correlaqao e relativamente alto e e 
positivo. Isso significa que o aumento da variavel X 'notas em Calculo' implica 
em um aumento consideravel da variavel Y 'notas em Estatfstica'. 

Vamos observar outro exemplo. A tabela a seguir exibe os dados sobre a quan- 
tidade vendida de certa mercadoria e os preqos alcanqados nos ultimos meses. 

Tabela 4.16 Numero de vendas e preqios alcan^ados 


Mes 

Quantidade vendida (em milhares) 

Pre^o (em dolares) 

1 

50,0 

4,9 

2 

68,4 

4,8 

3 

65,3 

4,7 

4 

69,0 

4,6 

5 

82,3 

4,5 

6 

109,1 

4,4 

7 

99,9 

4,3 

8 

128,6 

4,2 

9 

180,0 

4,1 

10 

200,5 

4,0 


Fonte: Silver (2000, p. 223). 


Vamos montar o grafico de dispersao para essas variaveis e calcular seu 
coeficiente de correlaqao linear. Interessa-nos descrever o comportamento 
do volume de vendas em relaqao ao preqo — entao, o preqo fara o papel da 
variavel independente, enquanto o volume de vendas fara o papel da variavel 
dependente. 
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Grafico 4.2 Dispersao das vendas em funcao do prego 

VOLUME DE VENDAS EM RELAQAO AO 
PREQO 


0) 

CD 

250,0 

1 

E 

0^ 

200,0 

o> 

CD 

-o 

150,0 

c 

0) 

> 

0 

100,0 

"O 

0 

-O 

CD 

50,0 

TD 

0,0 

C 

CD 

=3 

o 

3: 


♦ ♦ ♦ 


3,80 4,00 4,20 4,40 4,60 4,80 

Prego da mercadoria (em dolares) 


5,00 


Fonte: Da autora (2014). 


Aparentemente, ha correlaqao entre as variaveis. E, de fato, se calcularmos 
a correlaqao, encontraremos r = - 0,93. Podemos concluir que ha uma alta 
correlaqao entre as variaveis, sendo que o crescimento de uma (preqo) provoca 
o decrescimento da outra (vendas). 

Uma vez que ha correlaqao linear entre as variaveis, nosso objetivo agora 
sera encontrar a equaqao da reta que melhor descreve essa situaqao. De posse 
dessa equaqao, poderemos utiliza-la pra obter informaqoes que nao foram 
observadas diretamente, mas que podem ser obtidas na analise grafica. Por 
exemplo, na pesquisa, nao foi mencionada a quantidade de vendas se o preqo 
da mercadoria for cinco dolares, mas se tivermos a equaqao da reta que melhor 
aproxima os pontos, poderemos encontrar uma aproximaqao muito boa para 
esse valor. Do mesmo modo, se quisermos ter uma ideia da quantidade de 
vendas esperadas caso o valor da mercadoria for de tres dolares e cinquenta 
centavos, procederemos da mesma maneira. 

Vamos, entao, aprender as tecnicas para encontrarmos a reta que melhor 
aproxima os pontos observados. Esta tecnica e conhecida como regressao linear 
e o metodo para encontra-la recebe o nome de metodo dos mfnimos quadrados. 

3.4 Regressao linear 

Queremos aproximar os dados do grafico de dispersao por meio de uma 
reta cuja equaqao e da forma y = a + p • x, onde a e chamado de coeficiente 
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linear da reta e p e chamado de coeficiente angular da reta. Esses valores a e 
P sao constantes e sao eles que a caracterizam: cada reta tern um valor para 
a e um valor para p fixos. Para traqar a reta, vamos, entao, fornecendo valores 
para x (variavel independente) e encontrando um unico y tal que y = a + p-x. 

Icone — E importante lembrar que a e p sao duas letras gregas chamadas 
alfa e beta. 

Voltemos, agora, para a nossa situaqao inicial e vamos traqar uma reta que, 
aparentemente, aproxima-se de todos os pontos observados da melhor maneira 
possfvel (esse procedimento chama-se regressao linear). Provavelmente, nenhum 
dos pontos (Xj, yi) da amostra pertence a reta, conforme voce pode observar. 
Assim, para cada X; da amostra, teremos y; = a + p • Xj + e ir onde e, e o erro 
cometido — a distancia entre a reta e cada y ; — tambem chamado de resfduo. 


Grafico 4.3 Resfduos 


3 

O 


VOLUME DE VENDAS EM RELAQAO AO 
PREQO 



Prego da mercadoria (em dolares) 


Fonte: Da autora (2014). 


O modelo de regressao linear supoe que a media dos valores s, deve ser 
zero. Como consequencia, 

Ou seja, y = a + p • x. 

Assim, temos dois valores para serem encontrados, a e p. 

Da matematica basica, sabemos que, quando precisamos encontrar duas 
incognitas, precisamos de um sistema com duas equaqoes que as envolvam. 
O modelo de regressao linear nos forneceu uma das equaqoes: y = a + p • x. 
Precisamos de mais uma relaqao entre a e p para podermos encontra-los. 
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Para que a media dos valores s, seja zero, temos que —---— = 0 . 

n 

Como neo tamanho da amostra e, portanto, nao e zero, (s-, + e 2 + ... + s n ) = 0. 
Mas, para cada i, quern e Sj? 

Uma vez que y = a + p • x, + s,, se considerarmos y = a + p • x v veremos 
que + y, — yi para cada i. Portanto, se a soma dos resfduos deve ser zero, 

(ys - yi) + (y 2 - y 2 ) + ••• + (y n - y n ) = o 

Mas esse fato nao garante que a reta seja a mais proxima possfvel, pois o 
resfduo encontrado para certo i pode anular um resfduo encontrado para certo 
j (i a j). Observe a situaqao: 

Grafico 4.4 Fun^ao 



Observe o desenho: os dois resfduos, embora grandes, possuem tamanho 
similar, mas sinais diferentes. Logo, quando forem somados, irao resultar em 
um numero proximo de zero. 

Para contornar esse problema, em vez de minimizar a soma dos resfduos, 
vamos minimizar a soma do quadrado dos resfduos. Assim, teremos apenas 
valores positivos envolvidos no calculo e, para que a soma resulte em um valor 
proximo de zero, cada um dos resfduos precisa ser muito pequeno. 

(e, +e 2 +•••+£;;) = 0, ou seja, (y, - yd 2 + (y 2 -y 2 ) 2 + ••• + (y n -Yn) 2 = 0 

O criterio acima e conhecido como metodo dos mfnimos quadrados. 

Atraves dessa suposiqao e atraves de calculos matematicos, chega-se nas 
seguintes equaqoes: 
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11 II 


n - 2/, - ■ jy,- 

p = -- ' ' 


i=l i=i 


n • 


£•?-1 

i=l i=l 


/ \2 

v ! ' _1 J 


a=y- p• x 


Ou, de maneira mais condensada: 

a =F-3- X 

Atengao — Como estamos utilizando dados de uma amostra para encontrar 
a equa^ao da reta que melhor aproxime os dados, na verdade, estamos esti- 
mando a verdadeira equa^ao da reta. Por essa razao, escrevemos Y = a +(3 • X . 

Vamos, entao, calcular a regressao linear para o problema do volume de 
vendas em relagao ao prego, utilizando o metodo dos mimmos quadrados. A 
mesma tabela auxiliar que montamos para calcular a correlaqao nos ajuda no 
calculo das variaveis a e p. 


Tabela 4.17 Tabela Auxiliar 


i 

Xj (preco) 

Yi (vendas) 

Xi 2 

Vi 2 

Xj • rij 

1 

4,9 

50,0 

24,0 

2500,0 

245,0 

2 

4,8 

68,4 

23,0 

4678,6 

328,3 

3 

4,7 

65,3 

22,1 

4264,1 

306,9 

4 

4,6 

69,0 

21,2 

4761,0 

317,4 

5 

4,5 

82,3 

20,3 

6773,3 

370,4 

6 

4,4 

109,1 

19,4 

11902,8 

480,0 

7 

4,3 

99,9 

18,5 

9980,0 

429,6 

8 

4,2 

128,6 

17,6 

16538,0 

540,1 

9 

4,1 

180,0 

16,8 

32400,0 

738,0 

10 

4,0 

200,5 

16,0 

40200,3 

802,0 

Total 

44,5 

1053,1 

198,9 

133998,0 

4557,7 


Fonte: Da autora (2014). 
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Assim, 


P 



i =1 i =1 

/ V 

n 




10- 4557,7-44,5- 1053,1 
10- 198,9-(44,5) 2 


-155,9 


a = y-p- 


_ 1053,1 

x =- 

10 


(-155,9)- 


44,5 

10 


798,9 


Assim, a reta que melhor aproxima os dados da amostra e dada pela equa- 
qao Y = 798,9-155,9- X. 

Exemplo: Consideremos a situaqao proposta no topico anterior, em que eram 
analisadas as notas em Estatistica e em Calculo obtidas pelos estudantes de 
Engenharia Eletrica de uma determinada universidade. Vimos que as variaveis 
X - nota em Calculo — e Y — nota em Estatistica — estavam correlacionadas 
linearmente. Vamos, entao, utilizar o metodo de minimizaqao dos quadrados 
para encontrar a reta que melhor aproxima os dados da amostra. Relembrando 
a tabela auxiliar 4.15 que construfmos para calcular a correlaqao entre as va¬ 
riaveis era a seguinte: 


Tabela 4.15 Tabela Auxiliar 


i 

Xi 

Yi 

Xi 2 

Yi 2 

X; • rij 

i 

4 

5 

16 

25 

20 

2 

6 

7 

36 

49 

42 

3 

7 

8 

49 

64 

56 

4 

6 

5 

36 

25 

30 

5 

9 

9 

81 

81 

81 

6 

8 

8 

64 

64 

64 

7 

8 

5 

64 

25 

40 

8 

2 

4 

4 

16 

8 

9 

2 

5 

4 

25 

10 

10 

5 

4 

25 

16 

20 

11 

4 

6 

16 

36 

24 

12 

9 

8 

81 

64 

72 

Total 

70 

74 

476 

490 

467 


Fonte: Da autora (2014). 
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2Ji- yi~Z/r 2Ji 

(3 = ^^ 


i =1 i =1 


/I 


/ \2 

5/, 


12 ' 467 - 7 °- ? 2 4 =0,522 


12- 476-(70) 


74 70 

a=y-P- x =-(0,522)- — = 3,121 

H 12 12 

Assim, a reta que melhor aproxima os dados da amostra e dada pela equa- 
qaoF = 3,121 + 0,522- X. 

Grafico 4.5 Notas dos estudantes de engenharia eletrica da universidade 
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ro 3 
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4 6 

Notas em Calculo 


8 10 
y = 0,5222x + 3,1207 


Fonte: Da autora (2014). 


A regressao linear e, portanto, a reta que melhor aproxima os dados de 
uma amostra onde duas variaveis sao analisadas conjuntamente. O que isso 
significa? 

Voltemos ao exemplo anterior das notas em Calculo e em Estatfstica. O mo- 
delo de regressao linear nos forneceu a seguinte equaqao: Y = 3,121 + 0,522 ■ X. 
Note que o valor de a— no caso, a = 3,121 — independe de X. Isso significa 
que, mesmo sem nota em Calculo, e de se esperar que o aluno obtenha nota 
3,122, ou seja, e a nota inicial em Estatfstica segundo o modelo. Ja a constante 
P — no caso, P = 0,522 — nos fornece a proporqao com que Y varia quando 
X varia. Nesse caso, cada alteraqao na nota de Calculo (X) altera a nota de 
Estatfstica a uma proporqao de 0,522 (ou 52,20%). 
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E claro que a reta nao descreve exatamente o comportamento da relagao 
entre as variaveis, mas da uma estimativa para o comportamento conjunto de- 
las. No exemplo anterior, das notas em Calculo e Estatistica, se procurarmos a 
nota de Estatistica (variavel Y) correspondente a nota 6 em Calculo (variavel X) 
na reta, encontraremos Y = 3,121 + 0,522 • 6 = 6,25 , ou seja, de acordo com a 
equagao da reta, quern tern nota 6 em Calculo obtem nota 6,25 em Estatistica. 
Por outro lado, na amostra, dois estudantes tiraram 6 em Calculo: um tirou 5 
em Estatistica e o outro tirou 7! O fato dos valores observados serem diferen- 
tes do obtido via regressao nao significa que houve erro no calculo, pois sao 
informagoes diferentes: o dado obtido via equagao e uma estimativa. 

Esse exemplo ilustra o cuidado que devemos ter ao trabalharmos com a 
linearizagao: a regressao e uma estimativa que descreve o comportamento 
conjunto dos dados, mas nao significa que podemos replicar os dados da 
amostra com ela. 

Por outro lado, a equagao e bastante util para tirarmos informagoes sobre 
dados dos quais nao dispomos. 

Suponhamos que estivessemos interessados em obter uma estimativa para 
a nota de um estudante que obteve 4,5 em Calculo. Nenhum dos estudantes 
que fez parte da amostra obteve essa nota e, portanto, nao podemos utilizar 
informagoes da tabela de distribuigao. Por outro lado, podemos estimar um 
valor para ela atraves da equagao da reta: 

Y = 3,121 + 0,522• X = 3,121 + 0,522- 4,5 = 5,47 

Assim, e estimado que esse estudante tenha tirado 5,47 ou 5,5 em Estatistica. 

Note que, na amostra, os dados de x variavam de 2 a 9, ou seja, x pertence 
ao intervalo fechado [2, 9]. Portanto, embora nao faga parte da amostra, x = 
4,5 tambem pertence a esse intervalo, pois e maior do que 2 e menor do que 
9. Quando o valor y que pretendemos estimar estiver associado a um valor x 
pertencente ao intervalo de valores da amostra, damos a esse processo o nome 
de interpolagao. 

E se quisessemos estimar a nota em Estatistica de um estudante que obteve 
10 em Calculo? Embora o valor 10 nao faga parte do intervalo de valores para 
x da amostra, o fato de estarmos aproximando os dados por uma reta (regressao 
linear) implica em podermos estimar a nota em Estatistica via equagao. Nesse 
caso, 7 = 3,121 + 0,522- 7 = 3,121 + 0,522- 10 = 8,34. 
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Assim, e estimado que o estudante que tenha nota 10 em Calculo tenha 
nota 8,3 em Estatistica. 

Quando o valor y que pretendemos estimar estiver associado a um valor x 
nao pertencente ao intervalo de valores da amostra, damos a esse processo o 
nome de extrapola^ao. 

Para a interpolaqao, qualquer valor estudado e aceitavel, uma vez que ele per- 
tence ao intervalo da amostra; ja no caso da extrapolaqao, precisamos ter alguns 
cuidados. Embora a reta esteja definida para qualquer numero real (propriedade 
de reta), o significado da variavel impoe restriqoes aos valores estudados. 


; 


Questdespara reflexao 


Voce consegue pensar em alguma restriqao para a extrapolaqao das 
notas dos estudantes? 


Exemplo: Vamos voltar ao exemplo do volume de vendas associado ao 
preqo da mercadoria. 


Tabela 4.16 Numero de vendas e preqios alcan^ados 

Mes 

Quantidade vendida (em milhares) 

Preq:o (em dolares) 

1 

50,0 

4,9 

2 

68,4 

4,8 

3 

65,3 

4,7 

4 

69,0 

4,6 

5 

82,3 

4,5 

6 

109,1 

4,4 

7 

99,9 

4,3 

8 

128,6 

4,2 

9 

180,0 

4,1 

10 

200,5 

4,0 

Fonte: Silver (2000, p. 223). 


Ja realizamos a regressao linear para essa situaqao e encontramos a seguinte 
equaqao da reta: 7 = 798,9-155,9- X. 
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Se quisermos estimar o volume de vendas caso o preqo da mercadoria seja 
de 6 dolares, teremos que 

Y = 798,9-155,9- X = 798,9-155,9• 6 = -136,27. 

Note que, embora os calculos estejam corretos, o valor encontrado e ne- 
gativo, o que nao faz sentido, uma vez que a variavel Y esta associada a quan- 
tidades. Por outro lado, fica evidente que cobrar 6 dolares pela mercadoria 
seria inviavel. Vamos encontrar o valor em dolares para o qual a quantidade 
vendida seria nula? 

Nesse caso, y = 0. 


7 = 798,9-155,9- X—^—so = 798,9-155,9• X 


0 = 798,9-155,9- X 
155,9- X = 798,9 
X = 5,12 

Assim, conclufmos que a mercadoria nao pode custar mais do que 5,12 dolares. 



Atividades de aprendizagem 


1. O custo mensal de manutenqao de determinado equipamento em 
uma industria esta sendo analisado em funqao da sua idade. Nove 
equipamentos adquiridos em diferentes anos tiveram o custo averi- 
guado, e os dados obtidos foram os seguintes: 


Tabela 4.18 Idade do equipamento em rela^ao ao custo mensal 


Idade do equipamento (anos) 

Custo mensal (reais) 

1 

8 

2 

13 

3 

18 

4 

28 

5 

24 

6 

26 

7 

29 

8 

32 

9 

37 
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a) Trace o grafico de dispersao. 

b) Faga a regressao linear e encontre a equagao da reta melhor 
ajustada. 

c) Com base no modelo de regressao linear, qual o custo mensal de 
um equipamento com 12 anos de uso? 

2. Uma empresa submete seus novos operarios a um teste de aptidao 
(X) e tres meses depois mede a produtividade desses funcionarios (Y). 
Os resultados estao na tabela a seguir: 


Tabela 4.19 Rela^ao entre a aptidao e produtividade dos funcionarios da empresa 


Funcionarios 

Aptidao(X) 

Produtividade (Y) 

A 

22 

45 

B 

25 

37 

C 

15 

25 

D 

19 

40 

E 

22 

33 

F 

18 

30 


a) Faga o diagrama de dispersao e calcule o coeficiente de correlagao. 

b) Encontre a equagao da reta de regressao. 

c) Para um individuo cujo resultado no teste de aptidao foi 20, qual 
foi a produtividade esperada? 

d) Para um individuo que obteve 28 no teste de produtividade, qual 
foi o resultado no teste de aptidao? 



Para saber mais 


Algumas vezes, os problemas que queremos estudar envolvem mais de duas variaveis, e preci- 
samos saber se a variagao de uma influencia linearmente na variagao das outras. Nesses casos, 
a regressao multipla e utilizada, consistindo em encontrar uma equagao matematica (no caso, 
a equagao de um piano) que descreva o comportamento de uma variavel em fungao de varias 
outras. Assim, a regressao linear e como um caso particular da regressao multipla. Caso voce 
tenha interesse em seguir seus estudos, consulte o livro de Urbano, que faz parte das references 
bibliograficas deste material. 
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Fique ligado! 

Nesta unidade, voce aprendeu que: 
j A media aritmetica e a media ponderada fornecem uma medida de 
posiqao que resume os dados obtidos para determinada variavel. 
j A variancia e o desvio-padrao nos informam como os dados obtidos 
estao distribuidos, ou dispersos, em torno da media obtida. 
j Existem a variancia amostral e a variancia populacional. Enquanto uma 
deve ser calculada nos estudos envolvendo amostras, a outra e utilizada 
quando trabalhamos com toda a populaqao. 
j O coeficiente de correlaqao linear nos da uma medida da dependencia 
linear entre duas variaveis, e seu numero deve estar entre -lei. 
j A regressao linear e a reta que melhor aproxima os dados observados 
para duas variaveis em um grafico de dispersao entre elas. 
j Os valores a e p sao constantes; sao eles que caracterizam a reta e, 
portanto, sao eles que devem ser encontrados. 
j O metodo dos mrnimos quadrados consiste em um metodo matematico 
que permite encontrar a e p, de modo que a soma dos quadrados dos 
residuos seja a menor possivel. 

j Interpolaqao e o processo de, dado um valor para x pertencente ao inter- 
valo da amostra, encontrar um valor estimado para y via regressao linear, 
j Extrapolaqao e o processo de, dado um valor para x nao pertencente ao in- 
tervalo da amostra, encontrar um valor estimado para y via regressao linear, 
j Sempre e possivel interpolar, mas e preciso cuidado na hora de extrapolar! 



Para concluir o estudo da unidade 

Caro estudante, 

A unidade que voce acabou de estudar e uma introduqao aos conteudos 
apresentados. Existem outras medidas resumo, assim como e possfvel ampliar 
a ideia da regressao linear entre duas variaveis para mais de duas variaveis 
atraves da regressao multipla. Voce pode aprofundar seu estudo consultando 
qualquer um dos livros didaticos que constam na bibliografia. Faqa isso! Nao 
se contente apenas com o que Ihe e apresentado, mas prossiga seus estudos. 
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Atividades de aprendizagem da unidade 


1. Em uma clfnica cardfaca, foram anotados os nfveis de colesterol (em 
mg/100ml) para trinta pacientes, homens com idade entre 40 e 60 
anos que foram a clfnica fazer um check-up. 


Paciente 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Colesterol 

160 

160 

161 

163 

167 

170 

172 

172 

173 

177 


Paciente 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

Colesterol 

178 

181 

181 

182 

185 

186 

194 

197 

199 

203 


Paciente 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

Colesterol 

203 

205 

206 

206 

208 

209 

211 

214 

218 

225 


Calcule o nfvel de colesterol medio e o desvio-padrao amostral. 

2 . Um posto de saude de certo bairro mantem um arquivo com o numero 
de pacientes que procuram o consultorio odontologico diariamente. 
Os dados obtidos no ultimo mes foram os seguintes: 

343451 6345343 

34355556 11 10 21 2 

3 15 2. 

Calcule a variancia populacional para essa distribuiqao. 

3. Adaptado de Novaes e Coutinho (2009). Uma agenda de turismo 
especializada em oferecer passeios opcionais para turistas que visitam 
determinada regiao esta estudando a variaqao na adesao a determi- 
nado pacote quando sao acrescentados ou tirados percursos do preqo 
cobrado. Eles obtiveram as seguintes informaqoes: 
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Tabela 4.19 Numero de adesoes ao pacote em rela^ao ao preq:o 


Pre^o ($) 

Numero de adesoes 

10 

50 

15 

51 

20 

48 

25 

43 

30 

42 

35 

45 

40 

39 

45 

38 

50 

40 

55 

34 

60 

32 

70 

30 

90 

25 


a) Faqa o grafico de dispersao. 

b) Ha correlaqao linear entre os dados? Justifique. 

c) Encontre a funqao matematica que explique a dependencia entre 
o numero de adesoes e o preqo do passeio opcional. 

d) Estime o numero de pessoas que farao o passeio opcional se o 
valor cobrado for de R$ 80,00. 

4 . Adaptado de Crespo (2005). Certa empresa, estudando a variaqao da 
demanda do seu produto em relaqao a variapao de preqo de venda 
(em unidades monetarias), obteve os seguintes dados: 


Tabela 4.20 Demanda do produto em rela^ao ao preqio de venda 


Pre^o (u.m.) 

Demanda 

38 

350 

42 

325 

50 

297 

56 

270 

59 

256 

63 

246 

70 

238 

80 

223 

95 

215 

110 

208 
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a) Determine os coeficientes de correlaqao entre as variaveis. 

b) Encontre a equaqao da reta ajustada. 

c) Se o preqo de venda for 75 u.m., qual sera a demanda estimada? 

d) Se o preqo de venda for de 110 u.m., qual sera a demanda 
estimada? 

e) Qual o valor maximo de preqo possfvel para que haja demanda? 

5. Adaptado de Magalhaes (2010). Uma industria submete seus novos 
operarios a um teste de aptidao (X) e tres meses depois mede a produ- 
tividade desses operarios (Y). Os resultados estao na tabela a seguir: 


Tabela 4.20 Rela^ao entre Aptidao e Produtividade dos Funcionarios 


Operario 

Aptidao(X) 

Produtividade (Y) 

A 

22 

45 

B 

25 

37 

C 

15 

25 

D 

19 

40 

E 

22 

33 

F 

18 

30 


a) Encontre a equaqao da reta de regressao. 

b) Para um indivfduo cujo resultado no teste de aptidao foi 20, qual 
e a produtividade esperada? 

c) Para um indivfduo que obteve 28 no teste de produtividade, qual 
foi o resultado no teste de aptidao? 
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